? Eine URL ist ein Uniform Resource Locator . Das ist die Adresse Format für eine Web -Seite. URLs sind nicht auf bestimmte Zeichen zu behandeln und so müssen diese als " entgangen ", das ist eine Methode der Signalisierung an den Web-Browser , dass die folgenden Zeichen als Zeichen verarbeitet werden soll und nicht durch irgendeine Bedeutung der Browser ist so programmiert, um sie zu befestigen. Flüchten Sonderzeichen heißt URL-Codierung und die Programmiersprache Perl hat eine einfache Methode für den Umgang mit dieser Aufgabe . Perl
Perl ist eine Textverarbeitung Programmiersprache, die häufig verwendet wird, um Web-Seiten montieren . Web -Seiten werden in der Hypertext Markup Language , die über keine Programmierung Konstrukte geschrieben. Web -Designer, Web-Seiten angepasst Benutzer Umstände und Aktionen wollen erstellen Perl Programme, die eine Web -Seite die Inhalte anzupassen anstatt schriftlich eine statische HTML -Webseite.
Encoding
HTML Seiten enthalten oft URLs als Links, die auf den Betrachter von der Seite gezeigt werden , oder als Anrufe zu anderen Dateien in der Haupt- HTML-Seite eingebettet . Diese Hinweise auf Adressen , die Konventionen , die von der Hypertext Transfer Protokoll festgelegten folgen . HTTP trägt Botschaften zwischen Browsern und Web-Servern und seine Spezifikation enthält Zeichen , die vermieden werden sollten . Die meisten der Urkunden , die codiert werden müssen, sind nicht-alphanumerische Satzzeichen , und diese sind eher in Parameter am Ende einer URL übergebene Zeichenfolge auftreten .
Methode
Perl enthält eine Funktion namens uri_escape , die kümmert sich um alle HTTP- Anforderungen zu entkommen . Die Funktion führt eine als Parameter , die in einer Variable enthalten sein können. Es gibt dann die Zeichenkette mit beliebigen URL empfindlich Urkunden kodiert. Die uri_escape Funktion führt eine optionale zweite Parameter, der die Standard-Funktion von Flucht URL -sensitive Charakter zu entkommen , was Zeichen erscheinen in diesem Parameter überschreibt .
ASCII Codes
URL Codierung entweicht Zeichen , indem Sie sie mit diesem Zeichen der ASCII-Code , unter Voranstellung der Prozent -Zeichen ( "%") . Der ASCII-Zeichensatz ist weit verbreitet in der Informatik verwendet . Es weist eine Reihe zu jedem gängigen Charakter. Diese Zahl wird entweder dezimal oder hexadezimal ausgedrückt. Hexadezimal ist eine Basis 16 Zählsystem und umfasst die Ziffern 0 bis 9 und den Buchstaben A, B , C , D, E und F. URL-Kodierung verwendet die Hexadezimalzahl. Der Raum hat einen besonderen Charakter , weil es so häufig verwendet wird. Dies ist das Pluszeichen ( "+") . Ein Raum kann auch durch seinen ASCII-Code dargestellt werden als "% 20 ".