Vergleich

Aus Dupe Files Wiki

Wechseln zu: Navigation, Suche

Inhaltsverzeichnis

Vergleich

Dupe Files überprüft Ihre Dateien in verschiedenen Schritten und zwar jede Datei mit jeder anderen aus der Liste.

Ohne dies wäre nicht mit absoluter Sicherheit zu sagen, dass es sich um ein Duplikat handelt oder nicht.

Um Rechenzeit und Ressourcen auf Ihrem System zu sparen, geht Dupe Files hierbei in drei Schritten vor, damit nicht eine Datei unnötigerweise mit hundertausend anderen Dateien verglichen werden muss.

Der erste Schritt - Die Dateigröße

Dupe Files sammelt Informationen über die zu überprüfenden Dateien. Hierzu gehört selbstverständlich der Dateiname, das Verzeichnis, aber wichtiger sind die Dateigröße.

Diese ist das erste Kriterium für den Vergleich. Ist die Dateigröße einer Datei aus der Liste der zu überprüfenden Dateien genau gleich groß wie die einer anderen Datei aus der Liste, wird diese Datei in Schritt 2 weiter geprüft. Falls nicht, fällt die Datei aus der Überprüfung heraus und die Liste der relevanten Dateien verkleinert sich.

Der zweite Schritt - Hash / Prüfsumme

Der Hash (zu Deutsch auch "Prüfsumme") einer Datei ist wie ein Fingerabdruck. Da man beim Berechnen eines Hash nicht alle Informationen einer Datei berücksichtigt, sondern nur Streupunkte, geschieht das Erstellen eines Hashs relativ schnell.

Wenn man beispielsweise bei einer 100 MB großen Datei nur an 100 verschiedenen Stellen in der Datei prüft, was dort steht, geht das schneller, als würde man alle Bytes der Datei prüfen, was einem vollständigen binärem Vergleich gleich käme.

Daher überprüft Dupe Files, wenn zwei Dateien exakt die selbe Dateigröße haben, zuerst den Hash der beiden Dateien. Ist dieser gleich, ist es relativ wahrscheinlich, dass die Dateien binär identisch sind.

Ist der Hash unterschiedlich ist sicher, dass sie unterschiedlich sind. Dann fällt die Datei aus der Überprüfung heraus.

Der dritte Schritt - Binärer Vergleich

Im dritten und letzten Schritt überprüft Dupe Files die Dateien binär, das heisst Byte für Byte.

Ist auch dieser Vergleich erfolgreich, also sind alle Bytes identisch mit denen der anderen Datei handelt es sich einhundertprozentig um ein Duplikat.

Persönliche Werkzeuge