Der US Postal Service verwendet die optische Zeichenerkennung (OCR )-Technologie , um die Adressen auf Briefstücke lesen. Für die E-Mail lesbar zu sein durch eine OCR Postsortierer , jedoch müssen die Adressen und Schriftarten formatiert eine bestimmte Weise werden. OCR-Software ist nützlich für die Umwandlung gescannter Bilder von typisierten oder handschriftliche Dokumente auf elektronische durchsuchbaren Text , aber es hat Nachteile, die ihre Anwendungen zu begrenzen. Begrenzte Dokumente
OCR funktioniert am besten mit guter Qualität typisierte Dokumente. Handschriftliche Dokumente können nicht einfach durch OCR-Software gelesen werden. Ebenso typisierte Schriftarten, die Handschrift ähneln - schaffen viele Fehler bei der OCR-Prozess - sowie nicht-lateinische Schriften. Wenn das Dokument schlechten Kontrast , zerknittertes oder schmutzig ist, oder der Text und der Hintergrund sind ähnlich in der Dunkelheit , dann OCR kann nicht gut funktionieren. OCR hat Schwierigkeiten, mit Dokumenten, die sowohl Bilder als auch Text haben . Spreadsheets produziert auch mehr Fehler .
Genauigkeit
Kein OCR-Software ist zu 100 Prozent genau. Die Anzahl der Fehler hängt von der Qualität und Art des Dokuments , einschließlich der verwendeten Schriftart . Fehler, die während OCR auftreten, gehören Verlesen Briefe, überspringt Buchstaben, die nicht lesbar sind, oder Vermischen Text aus benachbarten Spalten oder Bildunterschriften . Wenn eine hohe Genauigkeit erforderlich ist - wie bei Umwandlung digitaler Bücher in ein elektronisches Format - dann ein clean-up des elektronischen Textes benötigt werden
Workarounds
< br . >
OCR hat Schwierigkeiten bei der Unterscheidung zwischen Zeichen , wie die Zahl Null und ein großes " O " Um dies zu umgehen , kann eine spezielle OCR-Schrift verwendet , wie das Schreiben aus Null werden. Allerdings funktioniert dies nur für Dokumente mit OCR im Hinterkopf entwickelt , wie Fragebögen . Bei der Erstellung von Fragebögen, die per Hand geschrieben werden , die Forscher auch Boxen für jeden Buchstaben .
Zusätzliche Arbeiten
Auch wenn das gescannte Bild des ursprünglichen Dokuments ist hoch - Qualität, zusätzliche Schritte auftreten müssen, um aufzuräumen den OCR- Text. Es ist sehr arbeitsintensiv , um die Fehler, die durch OCR erstellt korrigieren. Eine Person muss manuell vergleichen das Originaldokument und die elektronischen Text . Menschen machen auch Fehler bei der Eingabe von Text aus einem Dokument , aber manchmal ist es schneller , um die OCR Schritt überspringen.