Bei der Optimierung der Prozesse spielt in vielen Unternehmen und Organisationen die Digitalisierung von Dokumenten und Schriftstücken eine ganz entscheidende Rolle. Es gilt, beispielsweise aus Rechnungen, Akten, Formularen, Urkunden, E-Mails, PDF-Dokumenten oder sonstigen, nahezu beliebigen Unterlagen die jeweils relevanten Informationen zu extrahieren, um sie dann weiterverarbeiten zu können.
Vielfältige Anwendungsszenarien für automatische Texterkennung
Die früher mangels anderer Optionen zwangsläufig übliche, manuelle Erfassung ist dabei extrem aufwändig. Mitarbeiter müssen Dokumente lesen, Inhalte erfassen und eingeben. Ein Prozess, der nicht nur zeitraubend, sondern häufig auch fehleranfällig ist. Die Lösung heißt in den meisten Fällen „Optical Character Recognition“, kurz OCR. Im Deutschen auch schlicht als „Texterkennung“ bekannt, sind OCR-Systeme in der Lage, Text innerhalb von Grafiken zu erkennen – also beispielsweise aus einem Scan oder einem PDF. Die Anwendungsmöglichkeiten sind extrem vielfältig, gerade auch im Bereich des digitalen Informationsmanagements. Sie reichen bis hin zu sehr performanten Volltext-Suchfunktionen in Archivsystemen, die unternehmensweit Content aus unterschiedlichsten Datenquellen einbeziehen können.
Die Grenzen der Technik
Die OCR-Technologie funktioniert mittlerweile zwar grundsätzlich gut, stößt immer wieder aber auch an Grenzen. Dies kann beispielsweise dann der Fall sein, wenn ein Dokument teilweise beschädigt ist (der typische „Kaffeefleck“ im Büro) oder es sich um eine schwer entzifferbare Handschrift handelt. Auch spezielle Schriften und andere Sprachen – hier seien beispielsweise Arabisch oder asiatische Schriftzeichen genannt – können die automatische Texterkennung teilweise noch auf eine harte Probe stellen.
Convolutional Neural Networks revolutionieren OCR-Lösungen
Allerdings steht die nächste Generation von OCR-Software bereits in den Startlöchern. Eines der Zauberworte heißt dabei CNN. Gemeint ist logischerweise nicht der US-amerikanische Nachrichtensender, sondern die Abkürzung steht in diesem Fall für Convolutional Neural Network. Solche künstlichen neuronalen Netze sind Architekturen aus dem Bereich des Deep Learnings. Sie werden beispielsweise für die Objekterkennung auf Fotos verwendet, kommen aber vermehrt auch in einer neuen Generation von Lösungen für die automatische Texterkennung zum Einsatz. Stark vereinfacht ausgedrückt, sind CNNs in der Lage, nicht nur Buchstaben zu erkennen, sondern Textinhalte tatsächlich zu verstehen. Dies erlaubt im nächsten Schritt Rückschlüsse auf möglicherweise fehlende oder unleserliche Informationen: Die Software erkennt beispielsweise, welches Wort oder welcher Satzteil logischerweise ergänzt werden muss. Abseits von typischen Business-Anwendungen in Unternehmen und Organisationen eröffnet dies übrigens zum Beispiel auch in der Wissenschaft spannende Anwendungsmöglichkeiten. So lässt sich OCR gepaart mit Convolutional Neural Networks etwa bei der IT-gestützten Restaurierung historischer Schriftstücke oder Bücher einsetzen. Denn die intelligente Software kann auch anhand von Fragmenten prognostizieren, was ein Autor vor mehreren Hundert Jahren vermutlich geschrieben hat.
Die passende Lösung für Sie
Auch wenn die von Ihnen genutzten Daten und Dokumente vermutlich wesentlich jünger sind: OCR-Lösungen der nächsten Generation sind äußerst spannend und bergen im Zuge der digitalen Transformation das Potenzial für erhebliche Optimierungen. Gerne stehen Ihnen unsere Experten dabei zur Seite, das individuell auf Ihre Anforderungen zugeschnittene Konzept zu entwickeln und umzusetzen.