OCR-Erkennung

Um bei der OCR-Erkennung eine hohe Erkennungsrate zu erreichen, ist eine qualitativ hochwertige Digitalisierung Voraussetzung. Erkennungsraten unter 99.99% sind in der Praxis nahezu unbrauchbar.

Störende Elemente wie durchscheinende Rückseiten, Verschmutzungen, wechselnde Kontraste, wechselnde Sprachen und Schriftzeichen, können die Erkennung erheblich beeinflussen. siehe auch Bildbearbeitung und Bildoptimierung.

Ein besondere Herausforderung sind Frakturschriften in seinen unterschiedlichsten Ausprägungen. Ohne manuelle Nachbearbeitung sind hier keine brauchbaren Ergebnisse möglich.

Erkennungsraten von 99% oder gar von 99,99% hören sich zunächst einmal gigantisch gut an, sind es bei näherer Betrachtung aber nicht.

 

Ein Beispiel:

Eine DIN A 4 Seite enthält etwa 2.000 Zeichen. Bei einer Erkennungsrate von 99% bedeutet dies, 20 nicht erkannte Zeichen.

Bei einer Erkennungsrate von 99.99% sind es noch 2 Zeichen, die je Seite nicht korrekt erkannt werden.

Copyright 2011 | Designed by AMC24 .
Joomla Templates by Wordpress themes free