Text Parsing-Werkzeuge gibt es für Systemadministratoren und Web -Designer, die große Mengen an Text zu suchen , um die Struktur und Organisation der Computer -, System- Script bestimmen oder Mark-up Dokumente benötigen . Schnell und schmutzig SED und Perl-Skripte um reguläre Ausdrücke aufgebaut sind oft genug für einfache Arbeitsplätze, sondern Parsen komplexer XML-Dokumenten verlangt eine robustes Werkzeug , wie die Programmiersprache Python ElementTree Bibliothek. Things You
Python 2.5 oder höher
brauchen anzeigen Weitere Anweisungen
1
Starten Sie eine Terminalsitzung , oder, wenn Sie es bevorzugen, öffnen Sie die Python Integrated Development Environment , bekannt als IDLE , die in der Python -Verzeichnis in Ihrem Laufwerk C (Windows) oder Ordner Applications (Mac) gefunden werden kann. Überprüfen Sie Ihre Version von Python , indem Sie python- v auf der Kommandozeile . ElementTree ist Teil der Python Standard-Bibliothek als von Python 2.5 . Wenn Sie Python 2.4 oder früher haben , müssen Sie es aus dem Haupt Python -Seite herunterladen .
2
Bestimmen Sie die Art von Daten in einem XML-Dokument durch das Lesen der Root-Tag kodiert. An der Eingabeaufforderung , und seine Last ElementTree parse -Funktion mit dem folgenden Befehl:
> Import von elementtree.ElementTree parse
3
Suchen Sie die gewünschte Datei zu analysieren und notieren Sie sich den Weg in Bezug auf die der Python-Interpreter , oder bewegen Sie einfach die Datei in den Ordner Dokumente . Stellen Sie eine Variable für die Datei , lesen Sie es in den Speicher und entdecken Sie die Art der Daten die Datei enthält mit dem folgenden Befehl : > Baum = ElementTree ( file = Dateiname) > elem = tree.getroot () > drucken elem
Dies wird zeigen, welche Art von Daten im XML-Dokument verschlüsselt.