? Mit MySQL, gibt es zwei mögliche Zeichensätze für Ihre Daten in. Diese Unicode-Zeichensätze gespeichert werden spiegeln die Menge an Daten, die pro Zeichen in der MySQL-Datenbank gespeichert ist. Die Drei - Byte Unicode UTF-8 -Codierung (UTF-8 -Zeichensatz) ist allgemein anerkannt , aber es ist nicht der Standard-Zeichensatz für MySQL gesetzt . Was sind Zeichensätze ?
Zeichensätze sind Sätze von Standards, die alle verfügbaren Tastatureingabe Schlüssel enthalten . Die erste populäre Zeichensatz ASCII funktionierte gut für die englische Sprache , sondern als andere Nationen begann mit Computern und dem muss diversifiziert, neue Zeichensätze erforderlich waren. UCS-2 und UTF-8 sind beide Zeichensätze in der Lage ist die Eingabe von Daten aus fast jeder Tastatur der Welt.
Unicode UCS-2 -Codierung (UCS -2)
UCS -2 ist ein Zeichensatz, 16 Bit pro Zeichen verwendet , die Unterstützung der Basic Multilingual Plane (BMP) . Im Vergleich dazu verwendet ASCII nur ein Byte . Das Bit - Code-Werte zwischen 0 und 65535 und in UCS-2 , können in einer festen 16 -Bit-Wort codiert werden.
Drei - Byte Unicode UTF-8 -Encoding
Mit UTF- 8 ist der gleiche Zeichensatz und Bit - Code-Bereich als UCS-2 verwendet, aber es nutzt nur zwischen 1-3 Byte pro Zeichen . Während UCS-2 in einer festen 16 -Bit-Wort kodiert werden kann , UTF-8 kodiert entweder 8, 16 oder 24 Bit. UTF-8 ist eine neuere Standard als UCS-2 .
Warum MySQL Defaults zu UCS-2
MySQL ist eine sehr alte Datenbank-Anwendung und seine Schöpfung ging der Masse Umsetzung von UTF-8. Deshalb hat MySQL immer UCS-2 , die für die meisten Datenbank -Implementierungen ist begünstigt. Wenn Sie UTF- 8 statt nutzen möchten , können Sie dies tun , indem Sie die Datenbank-Einstellungen .