Wie man eine URL mithilfe von regulären Ausdrücken anzeigen

Mitglieder-Login

InformationenPython -Programmierung

Wie man Python Runde Make Up Die Programmiersprache Python enthält eine integrierte Rundungsfunktion bekannt Diese Funktion runde
Wie Durchlaufen aller Eigenschaften… Auf der grundlegendsten Ebene enthält eine Python-Klasse mindestens eine Variable , die irgendeine A
So erstellen Sie eine Buffer in Pyt… in Computer-Programmierung einen Puffer ist eine Zuweisung von Speicher , die eine temporäre Platz f
Wie man Python Offene Stellen Python ist eine interpretierte Programmiersprache, die für Unix /Linux-Anwendungen und in Web -Anwen

Programming

HOME

* Computer Wissen >> Programming >> Python -Programmierung >> .

Wie man eine URL mithilfe von regulären Ausdrücken anzeigen

Reguläre Ausdrücke stellen die Programmierer mit leistungsstarken Tools zur Textanalyse und Manipulation. Wo Anwälte Suche nach Kombinationen von Wörtern in E-Mails , die sich auf " schuldig" hinzufügen - - reguläre Ausdrücke gehören in jeder Programmierer die Werkzeugkiste überall aus E-Commerce- Formular-Validierung , um High-Stakes Rechtsstreitigkeiten gefunden . Leider steht ihre arkanen Syntax als ein Hindernis für viele Nutzer , die davon profitieren könnten . Eine mögliche Anwendung ist das Scannen einen Text für Universal Resource Locator , umgangssprachlich als Web-Adressen bekannt. Die Python Programmiersprache erfüllt diese Aufgabe in nur wenigen Zeilen Code. Things You Need
Python 2.6 oder höher , werden mit der integrierten Entwicklungsumgebung IDLE
Text -Datei zum Testen
anzeigen Weitere Anweisungen
1

öffnen IDLE und erstellen testen Textdatei per Kopieren und Einfügen einige zufällige Text in die Datei zusammen mit einigen URLs . Speichern Sie die Datei in das Verzeichnis TestText.txt , das kommt in den Speichern Dialog , so dass Sie nicht haben, um über Wege zwischen den Python-Interpreter und diese Datei zu kümmern.
2

zu den wichtigsten Go IDLE -Fenster und geben

>>>> import re

am Python-Prompt . . Dies lädt Pythons reguläre Ausdrücke
3

Lesen Sie Ihre Test- Text in Python und halten Sie sie in Erinnerung mit den folgenden Befehlen :

>>> TestText = open (' OCB_1.txt ')

>>> raw = TestText.read ()

OCB_1.txt ist der Name meiner Test-Datei - eine Kopie und Paste Ambrose Bierce " ein Vorfall an der Owl Creek Bridge ", mit ein paar URLs in. in den obigen Befehlen eingefügt wird, wird die Textdatei geöffnet und der Variablen zugewiesen TestText , es wird dann in den Speicher mit der zugewiesenen Variable raw lesen
.
4

Pre- kompilieren den regulären Ausdruck , um die Beschleunigung der Parsen . Dies ist besonders nützlich beim Umgang mit großen Textdateien. Geben Sie die folgenden Befehle an die Python-Prompt :

>>> pattobj = re.compile ( 'https ://( [- \\ w \\ . ] + ) + ( : \\ D +) ? ( /( [ \\ w /_ \\ . ] * ( \\ ? \\ S +) ? ?)) ? ')
5

Rufen Sie den findall Methode , indem Sie den entsprechenden Befehl regex zusammen mit der Variable, die sich auf den Text in Erinnerung :

findallobj = pattobj.findall ( raw)

Dies schafft eine neue Variable , findallobj , dass die Muster ergab die regex enthält
6 .

Blenden Sie die URL die Regex mit dem Befehl print gefunden:

print ( findallobj )

die Ausgabe sieht etwa so aus:

[ ( ' www.sjca . edu '), ( ' www.cantlers.com /index.shtml ')]