2.3 Implement data deduplication
2.3.1 Implement and configure deduplication
2.3.2 Determine appropriate usage scenarios for deduplication
2.3.4 Implement a backup and restore solution with deduplication
Data deduplisering er en tjeneste i Windows Server 2016 som konserverer lagringsplass på NTFS volumer ved å lokalisere redundant data og beholde kun en kopi av dataen, i stedet for flere. En fordel med data deduplisering er at den opererer på volum nivå, ikke fil-nivå som flere andre kompresjonstjenester.
2.3.1 Implement and configure deduplication
Man må først installere rollen:
Install-WindowsFeature -Name FS-Data-Deduplication
Konfigurere deduplisering med Server Manager
Så kan man konfigurere deduplisering ved å navigere til Server Manager > File and Storage Services > Volumes > Høyreklikk på et volum > Configure Data Deduplication...I nedtrekslisten Data Deduplication kan man velge:
- Disabled: Foretar ingen deduplisering
- General purpose file server: Ment brukt med typiske filtjenerfunksjoner som delte mapper, Work folders, og Folder Redirection
- Virtual Desktop Infrastructure (VDI) Server: Ment for bruk sammen med Hyper-V. Filer som er i bruk eller som ikke er komplett blir optimalisert.
- Virtualized Backup Server: Ment å brukes med backup applikasjoner, deduplisering blir en prioritert prosess, og filer i bruk blir optimalisert
Spesifiser hvor gammel en fil må være for å kunne bli deduplisert.
Sett en schedule for når deduplisering skal kjøres:
Deduplisering kjøres normalt i bakgrunnen som en jobb med lav prioritet, men man kan definere vinduer hvor den kan kjøre med vanlig prioritet (Throughput optimization).
Man kan velge å starte en deduplisering manuelt med PowerShell:
Start-DedupJob -Volume D: -Type Optimization
Konfigurere deduplisering med PowerShell
# Aktiver deduplisering
Enable-DedupVolume -Volume D: -UsageType [Default|Hyper-V|Backup]
2.3.2 Determine appropriate usage scenarios for deduplication
Dedupliseringsprosessen krever en del av prosessoren og minnet, og bør legges til tidspunkter der serveren er lavt belastet, f.eks. om natten. Deduplisering fungerer ikke på krypterte filer.
Data deduplisering kan være aktuelt om man har:
- Mange filer
- Store relativt like filer (VHD, VHDX, ISO osv,)
- Lite diskplass
- Backup til disker
Data deduplisering inkluderer et verktøy kalt Data Deduplication Savings Evaluation Tool (Ddpeval.exe) som kan brukes til å teste et volum for å se hvor mye plass man kan spare.
2.3.3 Monitor deduplication
Man kan sjekke status på deduplisering med:
Get-DedupStatus | Format-List
Eller med Server Manager > File and Storage Services > Volumes.
For å se dedupliseringshistorien kan man sjekke ut loggen i Event Viewer > Application and Services Logs\Microsoft\Windows\Deduplicaton\Operational
2.3.4 Implement a backup and restore solution with deduplication
Data dedupliseringsalternativet Virtualized Backup Server er designet mtp. backup løsninger som f.eks. Microsoft System Center Data Protection Manager (DPM) hvor DPM kjører på en virtuell maskin og lagrer backups i VHD(X) filer på et volum med data deduplisering aktivert. Med dette alternativet vil dedupliseringsjobben kjøre med høy prioritet.