Die Textkomprimierungstechnik, die häufig verwendete Wörter durch ein einzelnes Zeichen ersetzt, wird als
Substitution bezeichnet .
So funktioniert es:
1. Häufige Wörter identifizieren: Der Algorithmus analysiert den Text und identifiziert Wörter, die am häufigsten erscheinen.
2. einzelne Zeichen zuweisen: Jedem häufigen Wort wird ein eindeutiges einzelnes Zeichen zugeordnet (normalerweise nicht Teil des ursprünglichen Alphabets).
3. Wörter ersetzen: Der Originaltext wird dann gescannt und jedes häufige Wort wird durch sein zugewiesenes einzelnes Zeichen ersetzt.
4. Speichern Sie die Zuordnung: Die Zuordnung von Zeichen zu Wörtern wird separat gespeichert, sodass der Text später dekomprimiert werden kann.
Beispiel:
Nehmen wir an, die häufigen Wörter in einem Text sind "das" und "" ist "und" zu ".
* Mapping:
* "Das" -> 'a' '
* "und" -> 'B'
* "ist" -> 'C'
* "zu" -> 'D'
* Drucktext: "Das ist ein großartiger Tag B Es ist sonnig, nach draußen zu gehen."
Hinweis: Diese Technik ist einfach, aber oft nicht sehr effizient, um große Textmengen zu komprimieren. Es kann effektiver sein, wenn sie mit anderen Techniken wie einer Kodierung von Lauflängen kombiniert werden.