Detalles clave
Automatización de las operaciones relacionadas con el tratamiento de documentos financieros.
-
DesafíoOptimizar el flujo de trabajo documental con ayuda del aprendizaje automático
-
SoluciónCaptura de datos y servicios de consultoría de ML para trazar el camino hacia una solución financiera personalizada impulsada por ML.
-
Tecnologías y herramientasTesseract, pila de ciencia de datos Python
Cliente
El Cliente es un proveedor de soluciones de software a medida para diferentes nichos de negocio. La empresa del cliente buscaba un proveedor de consultoría de aprendizaje automático para ayudar a implantar el ML en una solución personalizada de reconocimiento inteligente de documentos.
El sistema era necesario para factura automática y reconocimiento de declaraciones fiscales. Se esperaba que la solución permitiera automatizar las tareas relacionadas de los empleados humanos dedicados a trabajar con documentos financieros y datos críticos. Asimismo, se esperaba que facilitara el tratamiento de tareas monótonas.
Reto: optimizar el flujo de trabajo documental con ayuda del aprendizaje automático
El cliente buscaba la ayuda de consultores expertos en los métodos adecuados para implantar ML en la solución existente. La empresa necesitaba reconocer y digitalizar eficazmente los documentos en papel para usos posteriores, agilizar el flujo de trabajo de los documentos en papel y los procesos de extracción y clasificación de datos.
Las siguientes partes del Cliente tratamiento de documentos sistema necesitaba un impulso ML:
Como proveedor de soluciones de captura automática de datosESSID Solutions actuó como consultor experto ayudando a resolver algunas de las tareas más complejas. Propusimos al Cliente un método de integración de ML en el sistema existente para atender mejor las necesidades empresariales.
Solución: captura de datos y servicios de consultoría de ML para trazar el camino hacia una solución financiera personalizada impulsada por ML.
Nuestros consultores revisaron la solución existente y propusieron los siguientes cambios y planteamientos:
- Análisis fiscal OCR. Propusimos utilizar como alternativa una herramienta de código abierto, Tesseract, o mejor el software de ABBYY. El software OCR de alta calidad es la parte fundamental del sistema, ya que garantiza un proceso eficaz de reconocimiento de formularios fiscales y facturas y un resultado más preciso.
Ofrecimos el desarrollo de un sistema combinado para permitir las siguientes capacidades una vez finalizada la etapa de OCR:
- Emplear un enfoque basado en reglas para extraer los campos necesarios sin utilizar ML (por ejemplo, extraer datos del IBAN).
- En el texto extraído, utilice ML para clasificar palabras, palabras clave, frases, símbolos y otros elementos en clases separadas, como total, productos, fecha, remitente, destinatario, etc. (también describimos el esquema de marcado de datos).
Además, sugerimos sustituir Tesseract, de código abierto, por otra solución que ofreciera mejores resultados de reconocimiento. Propusimos combinar un enfoque de plantillas utilizado anteriormente por el cliente con algoritmos de ML.
Nuestro equipo de expertos prestó servicios de consultoría para mejorar la solución existente de procesamiento de documentos corporativos de distintos tipos. El resultado fue una hoja de ruta viable hacia el éxito.
Resultado: una hoja de ruta viable hacia el éxito en el uso del ML para la captura de datos.
ESSID Solutions consultó al Cliente sobre la posible mejora de la actual software de tratamiento de documentos. Nuestro equipo ofreció metodologías para que el Cliente adquiriera un software OCR de reconocimiento y procesamiento de facturas y declaraciones fiscales con el uso de aprendizaje automático.
La solución puede ayudar a automatizar los operaciones de tratamiento de documentosmejorar la experiencia del cliente y aumentar la eficiencia.
Nuestro asesoramiento en materia de construcción y reconocimiento fiscal OCR y procesamiento app proporcionó al cliente la asistencia necesaria para resolver complicados problemas de implantación de ML. Hemos elaborado una guía para crear una solución de captura de datos basada en ML en función de las necesidades y expectativas específicas.