PDF -Dateien erhalten Sie mit einem Standard- Format, um programmatisch öffnen und analysieren Daten von einem Nur-Lese- Dokument . Sie können die Java -Bibliotheken , um eine PDF -Dokument öffnen und lesen Sie die darin enthaltenen Informationen . Entweder speichert diese Informationen in einer Datenbank oder die Informationen anzuzeigen, an das Lesegerät zurück in Ihre Java-Anwendung . Anleitung
1
rechten Maustaste auf das Java Datei, die Sie verwenden, um die PDF-Informationen zu analysieren. Klicken Sie auf " Öffnen mit " und wählen Sie Ihre Java -Editor.
2
Import der PDF-Reader -Bibliothek. Fügen Sie den folgenden Code am Anfang Ihrer Java- Datei, um die Bibliothek zu importieren : import
com.asprise.util.pdf.PDFReader ;
3
Öffnen Sie die PDF-Datei . Der Parser ist in der " PdfReader " Klasse in der Bibliothek, die Sie soeben entfernt. Fügen Sie den folgenden Code, um die gewünschte Funktion zu verwenden, um die Datei zu analysieren , zu ersetzen " thepdf.pdf " mit Ihren eigenen PDF-Dateinamen :
PdfReader pdf = new PdfReader ( new File ( " thepdf.pdf " ;)) ; pdf.open ();
4
Analysieren Sie den Text aus der PDF-Datei . Der folgende Code analysiert den Inhalt von Seite eins in der PDF :
String pdfcontent = pdf.extractTextFromPage (0);
ersetzen die "0" mit der Seitenzahl , die Sie aus extrahieren die Datei . Die erste Seite beginnt bei 0 , so dass jede weitere Seite Index ist die Seite , die Sie möchten, minus 1 zu extrahieren, um für das zu kompensieren .
5
Schließen Sie die Datei , nachdem Sie die Analyse der Daten zu beenden. Der folgende Code schließt die Datei :
pdf.close ();