Die Levenshtein Algorithmus , gemeinhin als bearbeiten Abstand , ist die minimale Anzahl von Operationen bearbeiten musste eine Reihe von Daten , die Quelle string, in eine andere, das Ziel String zu verwandeln. Sequenzen von Buchstaben oder Zahlen enthalten Strings von Daten. Valid edit Operationen gehören Substitution , Insertion oder Deletion . Programme wie Rechtschreibprüfung und Autokorrektur- Tools zu nutzen diesen Algorithmus in ihren Betrieb. Während der Algorithmus das von den Computern und Smartphones verwendet wird, scheint entmutigend zu begreifen , ist der grundlegende Prozess zur Definition eines Edit-Distanz relativ einfach. Anleitung
1
schreiben oder geben Sie Ihre zwei Saiten auf einer Seite , so dass die Quellen String direkt über dem Zielzeichenfolge ausgerichtet ist. Zum Beispiel:
Katze (Quelle string) Schicksal (target string)
2
Identifizieren Sie die Daten , an denen eine Saite unterscheidet sich von den anderen. Zum Beispiel:
Cat (Quelle string) Schicksal (target string)
Die Buchstaben unterscheiden sich auf den ersten Punkt (C und F) , und das Ziel String hat einen zusätzlichen Datenpunkt ( E) .
3
Tragen Sie die kleinste Anzahl von Operationen bearbeiten ( Insertion, Deletion, Substitution ) möglich, die Quelle String an die Ziel- String ändern. Zählen Sie die Änderungen. Zum Beispiel:
Cat - > Ersatz für F C und Einsatz E -> Schicksal
Die Änderung erfordert zwei Bearbeitungsvorgänge , eine Substitution und einer Insertion, und kann nicht abgeschlossen werden, weniger . Daher ist der Abstand zwischen edit "cat " und " Schicksal " zwei .