Unicode -Codierung ist ein Standard, der von der Basis 256 ASCII-Zeichensatz erweitert . Es ermöglicht die Verwendung von Sonderzeichen , wie z. B. solche mit Akzent und andere Sprachen als Englisch . Python darstellen können Unicode-Strings mit dem " Unicode "-Typ . Ein Teil dieser Art umfasst Argumente und Ausnahmen soll Unicode Fehler zu behandeln sie auftreten sollten . Unicode Constructor
Die Unicode Konstruktor nimmt ein, zwei oder drei Parameter bei der Expression Saiten. Der erste Parameter ist der String selbst, die erforderlich ist, wenn die Funktion aufruft und Unicode konvertiert . Der zweite Parameter ist die Codierung . Wenn dieser Parameter weggelassen wird, ASCII-Zeichen größer als 127 in einem Fehler. Der dritte Parameter ist ein Fehler Antwort -Handler, der angezeigt wird, wenn der Konstrukteur nicht konvertieren können die Zeichenfolge in Unicode , auf der Grundlage der Codierung Regeln .
Ausnahmen
Wenn Unicode Fehler auftreten, kann das Programm werfen eine von mehreren eingebauten Ausnahmen , abhängig von der Art des Fehlers , was geschieht . Das Programm wirft eine " UnicodeError ", was bedeutet, dass eine Funktion hat einen Wert, der sich nicht um eine Unicode - Typ empfangen wird . Diese Ausnahme hat einige Unterklassen , die während mehr bestimmten Fällen , wie zum Beispiel der " UnicodeEncodeError ", " UnicodeDecodeError " und " UnicodeTranslateError " Ausnahmen auftreten . In den meisten Fällen wird ein Programm mit dieser spezifischen Ausnahmen im Gegensatz zu den generischen " UnicodeError " Ausnahme im Gegensatz zu reagieren.
Verursacht
In vielen Fällen Unicode Fehler treten aufgrund der Tatsache, dass jedes Zeichen durch mehrere Bytes dargestellt werden . Beim Lesen von Unicode-Strings in Brocken kann nur ein Teil der Zeichen für ein einzelnes Zeichen gelesen werden, was einen Fehler beim Dekodieren der Zeichen . Wenn ein Programm eine Unicode Fehler oder eine Exception wirft , es hält die Ausführung an diesem Punkt und manchmal wird dazu führen, das gesamte Programm zum Absturz zu bringen .
Auflösungen
Schreiben von Code in Unicode umgehen Fehler werden damit das Programm ohne Unterbrechung fortgesetzt und sogar Warnungen anzeigen , um den Benutzer über Ausnahmen. Wenn ein Block von Code zu einem Fehler , wie zum Beispiel den Benutzer auffordert, eine Zeichenfolge in Unicode eingeben , ermöglicht eine try-Anweisung das Programm den Code zu testen und dann eine von zwei Aktionen , abhängig davon, ob oder nicht das Ergebnis der Test einen Fehler verursacht.