Ubuntu bietet eine grafische und Kommandozeilen-Tools , um portable document Dateien (PDF) in Text-Format zu konvertieren. Die Kommandozeilen-Version , " pdftotext " , automatisiert den Prozess , indem sie die Umwandlung Befehl in ein Shell-Skript . Auf diese Weise können mehrere PDF -Dateien zur gleichen Zeit geändert werden. Eine Reihe von Kommandozeilen-Optionen mit dem Befehl ermöglichen bestimmte Aktionen (z. B. nur die Umwandlung der ersten paar Seiten ) stattfinden jedes Mal ausgeführt wird, zur Verfügung gestellt. Beziehen pdftotext
Besorgen Sie sich die entsprechenden Pakete und Befehl " pdftotext " aus den Ubuntu -Bibliotheken über den Befehl :
sudo apt- get install poppler -utils
sicher, dass das Paket korrekt installiert , bevor Sie es verwenden .
pdftotext Man Seite
Erfahren Sie, wie die pdftotext Befehl funktioniert und machen Sie sich mit den Kommandozeilen- Optionen zur Verfügung. Sehen Sie in der man-Seite für den Befehl Eingabe von " Mann pdftotext " in der Befehlszeile Shell-Eingabeaufforderung und drücken Sie "Enter " . Die Kommandozeilen-Optionen bestehen aus Buchstaben, ein Bindestrich , z. B. " -l" vorangestellt , und sie alle bieten verschiedene Funktionen.
Der Standard -Befehl für pdftotext ist " pdftotext " (ohne Anführungszeichen) , wo ist der Name der PDF-Datei zu extrahieren , wie " report.pdf " und ist der Name des Textausgabedatei wie " report.txt " . Sie können jeden Namen Ihrer Wahl .
Batch PDF Conversion
den Befehl testen , indem Sie versuchen es auf ein paar PDF Dateien einzeln . Wenn es in Ordnung ist , können Sie versuchen, mit ihm auf eine Reihe von PDF-Dateien in Shell-Skripten , um den Prozess zu automatisieren. Ein Beispiel für eine typische Skript ist unten dargestellt:
for i in * pdf
tun
pdftotext $ i $ i.txt
getan < . br>
Dieses Skript nimmt alle PDF-Dateien im aktuellen Verzeichnis und exportiert sie mit ihrem Namen in eine Textdatei , so " report.pdf " würde " report.pdf.txt "
geworden
geschützte PDF-Dateien
Manche PDFs sind entweder mit Passwörtern geschützt oder einzurichten , um den Export von Text aus dem Dokument zu verhindern. Dies ist ein Versuch , um Urheberrechte zu schützen , und wenn dies der Fall ist vielleicht sollten Sie besser überdenken die Umwandlung aus rechtlicher Sicht . Wenn Sie das Passwort für eine PDF-Datei haben, kann dies in den Kommandozeilen-Optionen für " pdftotext " weitergegeben werden.