Archiv für Kategorie Deduplizierung
Was ist Deduplizierung?
Verfasst von Robert unter Deduplizierung am 30. April 2010
Unter dem Begriff “Deduplizierung”, auch Datendeduplizierung oder Data-Deduplication genannt, wird in der Informationstechnologie ein Prozess verstanden, welcher zur Erstellung von Datensicherungen und Datenträgerabbilden dient. Beim Prozess der Deduplizierung werden redundante Daten identifiziert und gelöscht, bevor anschließend eine Spiegelung des Datenträgers geschrieben wird, welche auf einen weiteren Datenträger kopiert wird. Der Prozess der Deduplizierung komprimiert hierbei die Datenmenge, sodass eine lohnenswerte Datenverdichtung möglich ist. Die Effizienz dieser Datenverdichtung kann aufgrund der komplizierten Deduplizierungs-Algorithmen jedoch nicht hervorgesagt werden, da eine hohe Abhängigkeit zwischen der Datenstruktur und der Datenänderungsrate besteht.
Die Deduplizierung ist die derzeit effizienteste Art, ein Datenvolumen zu sichern, welches vorher geprüft und reduziert wurde, jedoch muss es sich um unverschlüsselte Daten handeln, welche eine Mustererkennung zulassen. Das Haupteinsatzgebiet der Deduplizierung ist die Datensicherung, die in der Praxis eine Verdichtung der Daten im Verhältnis von 1:12 ermöglicht. Die Deduplizierung eignet sich für sämtliche Einsätze, bei welchen Daten in regelmäßigen Abständen kopiert werden sollen. Natürlich könnten die Daten eines Datenträgers auch auf herkömmliche Art und Weise kopiert werden, jedoch würde eine derartige Vorgehensweise keine effektive Datenverdichtung ermöglichen. Beim Prozess der Deduplizierung wird “mehr gesichert und weniger gespeichert”, sodass der Prozess unter zeitlichen, als auch unter wirtschaftlichen Gesichtspunkten besonders lohnenswert ist. Die Deduplizierung sorgt somit für mehr Speicherplatz und weniger Redundanz. Sicherungslösungen mit Deduplizierung sind zwar ein großer Kostenfaktor, dennoch sorgen sie konstant für effektive Sicherungen, welche sich im Laufe der Nutzungszeit deutlich rentieren.