Ein Computer speichert die einzelnen Buchstaben und Zeichen von Text als eine Folge von Bits - binären Einsen und Nullen. Systeme kodiert das Alphabet , Satzzeichen und andere Symbole während des 20. Jahrhunderts entwickelt , was zu ANSI und Unicode. ANSI, die früher entstanden sind, verwendet weniger Bits , sondern beherbergt außereuropäischen Sprachen schwer ; Unicode umfasst viele asiatische und orientalische Zeichen sowie die römisch- Set für Englisch und andere europäische Sprachen verwendet . Größe
ANSI Set kodiert Zeichen mit acht Bit oder ein Byte Daten , so kann bis zu 256 verschiedene Symbole zu einem Zeitpunkt. Der Unicode-System verwendet 16 Bits oder zwei Bytes , Aufnahme 256 x 256 oder 65.536 Symbole . Darüber hinaus hat Unicode 17 Kodierebenen , so dass insgesamt mehr als 1 Million Symbole . Für Sprachen mit nicht-lateinischen Zeichensätzen ANSI verwendet einen zusätzlichen 16 -Bit-Zahl als Codepage bezeichnet . Ein Computer speichert diese Zahl einmal, nicht mit jedem Charakter , so dass mehr Flexibilität für den ANSI Kodierung .
Sprachen
Die ANSI -Set als "Windows 1252 " bekannt wobei " 1252 " in die Codepage Zahl bezieht , ist die beliebteste , für Englisch und mehreren europäischen Sprachen . Andere Codepages definieren weitere Sprachen , wie 1254 für türkische und 1255 für Hebräisch. Unicode , wegen seiner größeren Schriftgröße, Natur beherbergt mehr Symbole, auch für Thai, Braille , Cherokee und Old Persian.
Plattformen
ANSI wuchs von Microsoft Windows-Betriebssystem , nachdem sie von Microsoft und IBM entwickelt. Forscher von Apple und Xerox gemeinsam an Unicode , die Microsoft später angenommen. Zum Zeitpunkt der Veröffentlichung , unterstützt Windows sowohl ANSI und Unicode. Mac OS X verwendet eine eigene Acht-Bit- Zeichen-Code , ähnlich wie ANSI, und unterstützt auch Unicode . Das Linux-Betriebssystem bietet auch Unicode-Unterstützung .
Sortierung
Der Roman Zeichensatz traditionell erlaubt Benutzern, organisieren und sortieren Informationen über die Reihenfolge der Zeichen . ANSI -Codes folgte der Roman Charakter um , so dass der Wert eines "T" größer ist als die eines ist "B ", so Computer-Aufgaben wie Sortieren fast automatisch. Obwohl Unicode auch sortieren können Informationen über Charakter Ordnung basiert, ist es ein komplizierter Prozess . Die ersten 127 Unicode-Zeichen enthalten Groß-und Kleinbuchstaben in lateinischen Buchstaben , so dass Sortierung für Englisch und anderen europäischen Sprachen. Jede nicht-lateinische Sprache hat ihre eigene Art Formel oder Algorithmus .