Unicode Transformation Format ( UTF-8) ist ein Charakter -Encoding-Format , die Acht-Bit- Blöcke verwendet, um ein Zeichen darzustellen , und wird häufig in Computersystemen verwendet . Es umfasst die gleichen kompakten Klartext -Codierung als ASCII-Format , sondern ermöglicht auch die Codierung von Sonderzeichen. Dieses gibt ihm zusätzliche Funktionalität, sondern stellt eine Herausforderung , wenn in Programmcode verwendet . Die späteren Versionen von Perl Schiff mit Codierung Modulen und einer binmode Funktion, die die Programmiersprache , um die Codierung und Decodierung von UTF-8 -Dateien verarbeiten können. Eingang und Ausgang zu /von einem Perl-Programm werden können, um UTF -8-Zeichen durch die Verwendung eines Schalters auf der Kommandozeile zu behandeln. Things You
ActiveState Perl
Perl Editor
brauchen anzeigen Weitere Anweisungen
1
Starten Sie das Perl -Editor zu starten Kodierung der Perl-Programm . Sie können mit einem einfachen Text -Editor wie Notepad unter Windows oder den vi-Editor auf UNIX. Sie müssen die Datei mit einer . Pl Erweiterung speichern, so dass das System in der Lage sein , um es als Perl-Programm zu erkennen.
2
Platz ein Imperativ , um die " Encode "-Modul an der Spitze erfordern des Perl-Programm . Sie werden in der Lage sein , um die Codierung und Decodierung Funktionen im Körper des Perl -Programm verwenden zu codieren /decodieren Daten in /aus UTF -8-Format , je nach Bedarf . Geben Sie den folgenden in den Perl -Editor, um diese Methode zu verwenden :
# /usr /bin /perlrequire Encode ; Alternativ können Sie das Encode -Modul nennen , wie folgt:! Verwenden Encode ; Um Daten zu codieren , geben Sie die folgenden in den Körper Ihres Programms : $ output = Encode :: encode ( " utf8 ", $ string);
3
Geben Sie den UTF-8 -Encoding-Format , wenn Sie öffnen ein Datei.
Offen; : "encoding ( iso-8859- 7) < ", $ inputfile
Datei öffnen , : Sie können dies , indem Sie eine der folgenden Formate in den Editor zu tun fILE, " <: utf8 " . , $ inputfile ;
sagen Perl , um die Datei im UTF -8-Format kodieren , oder für UTF -8-Codierung vorbereiten
4
Geben Sie die " binmode " beim Lesen oder Schreiben von Dateien , um sicherzustellen, dass die Dateien im UTF -8-Format codiert sind .
die binmode auf UTF-8 gesetzt, wenn eine Datei lesen , geben Sie den folgenden in den Editor : $ filename = " filename.txt "; $ inputfile = IO :: File -> new ($ filename , "r" ); binmode ($ inputfile , ' : utf8 ');
< p > Um die binmode auf UTF-8 eingestellt werden, wenn das Schreiben in eine Datei , geben Sie den folgenden in den Editor : $ filename = " filename.txt "; open ( OUT , " > $ filename "); binmode (OUT, " ; : utf8 ");
benutzen Sie auch binmode um das Format der Standard- Ein-und Ausgabe in UTF- 8, wie folgt: binmode ( STDIN , ' : utf8 '); binmode ( STDOUT , " : utf8 ');