Tesseract optische Zeichenerkennung Bibliotheken bieten Entwicklern eine Methode, um Dokumente und Text zu einem Bild zu scannen. Sie verwenden die Tesseract Bibliotheken , um Bilder von Dokumenten, die Sie nicht mehr benötigen, in Papierform gespeichert werden. Sie verwenden Tesseracts Bibliotheken in Java durch Durchschleifen jedes Zeichen und Schreiben der Zeichen in einer Datei. Um die Bibliotheken zu verwenden, müssen Sie die Java Namespace für die OCR -Funktionen. Anleitung
1
rechten Maustaste auf das Java Datei, die Sie verwenden, um die OCR -Dokument zu erstellen . Klicken Sie auf " Öffnen mit " und wählen Sie Ihre bevorzugte Java -Editor.
2
Fügen Sie den OCR -Namespace am Anfang der Datei . Kopieren Sie den folgenden Code auf Ihre Quellcodedatei :
com.tplan.robot.imagecomparison.tesseractocr
3
erstellen den Code scannt , die Zeichen in der Datei. Zum Beispiel der folgende Code durchläuft jedes Zeichen in einer Datei und schreibt sie in eine Bild-Datei:
Var lines = 0Compareto method = " TOCR " cmparea = " x : 33, y: 2, w : 200 , H: 22 " for ( i = 1; {i} < { Linien } +1; i = {i} +1) { Typeline " { _TOCR_LINE {i} } "}
< br > 4
Klicken Sie auf den Java-Editor die Schaltfläche "Speichern" und dann auf " Ausführen", um den Code in einer Java-Debugger auszuführen.