OCR-basierte Lösung zum Abrufen von Daten aus Quittungen

Wichtige Details

Verbesserung der Effizienz der Back-Office-Abläufe um 42%.

Herausforderung

Extraktion von Informationen aus Quittungen durch maschinelles Lernen
Lösung

OCR-basierte Lösung für die Verarbeitung halbstrukturierter Daten aus Quittungen
Technologien und Werkzeuge

OpenCV, Python, C++, ABBYY Cloud OCR SDK

Kunde

Der Kunde ist ein Anbieter von personalisierten Lösungen im Bereich Banken und Finanzen. Der Kunde war auf der Suche nach Datenextraktionsdienste um Anwendungen für Unternehmen mit Hilfe von maschinellem Lernen zu verbessern.

Herausforderung: Extraktion von Informationen aus Quittungen durch maschinelles Lernen

Der Kunde stellte dem Team von ESSID Solutions eine mobile Anwendung zur Verfügung, mit der digitale Quittungen gespeichert werden konnten. Die Herausforderung bestand darin, diese Anwendung zu erweitern durch Anwendung des maschinellen Lernens.

Unsere Datenwissenschaftler beschlossen, die OCR-Technologie (Optical Character Recognition) einzusetzen, um einen Algorithmus zur Extraktion von Schlüsseldaten aus Rohbildern zu trainieren. Sie verwendeten auch klassische Computer-Vision-Methoden, um die Qualität eines erkannten Bildes zu verbessern, bevor sie die optische Zeichenerkennung auf Belege anwenden.

Lösung: OCR-basierte Lösung für die Verarbeitung halbstrukturierter Daten aus Quittungen

Der erste Schritt war die Vorverarbeitung digitaler Bilder für Datenextraktion. Unser Team nutzte Computer Vision, um Quittungen zu lesen.

Halbstrukturierter Text in Quittungen kann nicht nur reinen Text, sondern auch Abbildungen, Titel, Tabellen oder Nicht-Text-Elemente enthalten. Außerdem weisen Texte in Quittungen Attribute wie unterschiedliche Schriftarten, Symbole, Spalten usw. auf. Diese Eigenheiten tragen zu einer schlechten Zeichenerkennung bei. Der Ausweg bestand darin, sich auf eine sorgfältige Auswahl der Bereiche, eine genaue Extraktion der Daten aus jedem Bereich und die Zusammenfassung der Ergebnisse zu konzentrieren.
Unser Team entwickelte eine Lösung, die es ermöglichte, einen Beleg in mehrere Bereiche oder Boxen aufzuteilen, um die Daten Spalte für Spalte zu extrahieren, sie zu verarbeiten und automatisch in die erforderlichen Formulare oder das CRM des Kunden zu übertragen.

Eine weitere Herausforderung bestand darin, die Ziffern der Kontonummer und die Bankleitzahl zu extrahieren. Die Banken verwenden häufig spezielle Schriftarten, so dass ein Symbol aus mehreren Teilen besteht. Außerdem kann der Text auf den Schecks verwischt werden oder verblassen, was in einigen Fällen zu Erkennungsproblemen führen kann.

Unser Team hat eine Methode entwickelt, mit der es möglich ist, für jedes Symbol automatisch einen Begrenzungsrahmen zu berechnen. Dieser Ansatz ermöglichte es, jedes Symbol als Bild zu behandeln, um die ganze Zahl mit einem hohen Prozentsatz an Genauigkeit zu extrahieren.

Ergebnis: Automatisierung von Routineaufgaben und verbesserte Gesamtleistung

Das Team von ESSID Solutions unterstützte den Kunden bei der Automatisierung von Prozessen im Bereich der Datenextraktion. Der Kunde erhielt eine auf optischer Zeichenerkennung basierende Lösung, die in der Lage ist, zeitaufwändige und fehleranfällige Arbeiten zu eliminieren. Dazu gehörte auch die Verarbeitung von Daten über Finanztransaktionen aus Belegen.

Diese maßgeschneiderte Lösung kann zur Verbesserung der Effizienz von Back-Office-Workflows eingesetzt werden. Durch den Ersatz von Mitarbeitern, die mit Routineaufgaben beschäftigt sind, kann der Kunde mehr Talente für geschäftskritische Aufgaben einsetzen, die eine menschliche Aufsicht erfordern.