Die Möglichkeit, ein Dokument in maschinenlesbarer Form zu scannen ist ein unvergleichliches Zeitersparnis. Anstatt Abtippen das Dokument, und möglicherweise Fehler Einsetzen der eigenen, Scannen und Weitergabe des gescannten Bildes durch ein Software- Leser können in einem bearbeitbaren Dokument mit einem hohen Grad an Genauigkeit führen, wenn mit dem Original verglichen . Dieser Vorgang wird als Software zur optischen Zeichenerkennung . Optical Character Recognition
Optical Character Recognition (OCR ) ist ein Prozess, in dem gedruckten oder handgeschriebenen Text mechanisch oder elektronisch ausgelesen und in einer Form, die von einem Computer erfasst. Das anspruchsvolle Verfahren sieht die Buchstaben Formen und vergleicht sie mit einer Bibliothek von ähnlichen Formen. Wenn eine Übereinstimmung besteht, ist ein Charakter , der die Muster auf dem Bildschirm angezeigt wird, eingegeben oder in einer Computerdatei . OCR macht es möglich, dass ein Dokument eingescannt und von einem Computer gelesen werden, wodurch eine Datei, die bearbeitet oder auf andere Weise gehandelt werden.
OCR Software
Computer-Software ist für die moderne OCR -Implementierung verwendet . Die Software wurde von seinen frühesten Tagen vorgerückt , in denen die Programme für jede eindeutige font erwartet , zu erkennen, wurde kalibriert werden musste. Es ist erhältlich in Form als Standalone Programm, das speziell für die Aufgabe erstellt , und als Komponente in Scan-Software . Das Aufkommen des Internet und Cloud Computing hat zur Entwicklung von Web-basierten OCR-Programme geführt , wodurch die Notwendigkeit für individuelle Desktop-oder Server-Installationen .
Das Anerkennungsverfahren
< br >
OCR Software-Funktionen , indem zunächst die Anerkennung der Unterscheidung zwischen hellen und dunklen Bereichen des gescannten Bildes . Da es eine Hell-Dunkel- Unterscheidung entdeckt , sucht die Software für erkennbare Muster, wie vertikale und horizontale Linien , sowie angeschlossenen oder teilweise Kurven . Wenn es ein Muster wie ein Brief oder ein anderes Zeichen erkennen kann , sucht es seine Datenbank für das entsprechende Zeichen in der Computer- Sprache einzustellen. Es geht dann dieses Zeichen auf dem Dokument oder Anzeige steht die Montage . Wenn die Software nicht in der Lage , um ein Zeichen zu erkennen, kann es machen , die bestmögliche Annahme oder ersetzen einen alternativen Charakter , um den Prozess in Gang zu halten .
Mögliche Probleme mit OCR Software
< p> Seit OCR -Software beruht auf Mustererkennung ist jede Artefakt auf der Seite, die möglicherweise beeinflussen könnte diesen Prozess eine Quelle von Problemen . OCR funktioniert am besten , wenn es eine klare Unterscheidung zwischen den Zeichen und dem Hintergrund des Dokuments , idealerweise schwarz auf weiß . Farbige oder beschäftigt Hintergründe, die die Muster weniger unverwechselbar machen können Probleme verursachen. Flecken , Falten und andere Schäden an dem Dokument kann zu falschen Zeichenerkennung sowie führen.