
Nos complace compartir que la extracción de información de documentos ahora ofrece un nuevo modelo preentrenado para la extracción de órdenes de compra. Lea esta publicación de blog y aprenda de qué se trata y qué valor le aporta.
Con las capacidades inteligentes de Document Information Extraction (que forma parte de SAP AI Business Services Portfolio), la información se puede extraer fácilmente de los documentos comerciales utilizando modelos de IA previamente entrenados. Los modelos preentrenados pueden extraer toda la información relevante de documentos estándar (como facturas, órdenes de compra, avisos de pago y tarjetas de presentación).
La siguiente captura de pantalla da una idea de la extracción, cuando se utiliza la extracción de información del documento:
Nos complace compartir que la extracción de información de documentos ahora ofrece un nuevo modelo preentrenado para la extracción de órdenes de compra. El nuevo modelo permite a los usuarios tener resultados de extracción significativamente mejores para elementos de línea más complejos, que son una parte típica de las órdenes de compra (por ejemplo, descripciones de materiales de varias líneas, estructuras de tablas complejas, una gran cantidad de elementos de línea, información de tablas anidadas , etc.).
Mientras el anterior modelo de extracción chargrid estaba utilizando un enfoque basado en visión y píxeles para la extracción, el nuevo modelo de extracción encantador se basa en una arquitectura de transformadores. Opera directamente sobre el resultado de la extracción OCR, explotando tanto el texto reconocido como la ubicación del texto en el documento. Este nuevo enfoque garantiza una clasificación precisa de textos y cantidades en documentos comerciales.
En las primeras pruebas, el modelo Charmer ha demostrado una mayor precisión de extracción para casi todos los campos, en particular para campos de fecha, cantidades y campos auxiliares que son importantes para hacer coincidir los socios comerciales, como los detalles de la cuenta bancaria del remitente, en el paso de enriquecimiento.
Los documentos del mundo real exhiben una variedad de características que complican la extracción de información. Hay incoherencias frecuentes en el formato de números y fechas, etiquetas o abreviaturas personalizadas ambiguas y diseños de tablas complejos con información anidada. El nuevo modelo encantador puede manejar muchos de estos casos. Además, proporciona un mejor manejo holístico de fechas ambiguas y cantidades con formato inconsistente. Además, puede adoptar diseños de tablas no triviales mucho mejores, con descripciones con diferentes longitudes y saltos de línea, celdas apiladas dentro de elementos de línea y otra información anidada. La captura de pantalla ilustra algunos de los desafíos mencionados que se pueden encontrar en documentos del mundo real:
Usando esta nueva versión del modelo de extracción, se puede esperar una mejora en los resultados de extracción de varios campos del documento, así como muchos casos extremos que antes no se podían manejar. El modelo muestra resultados mucho más consistentes para las tablas con muchas filas y brinda puntajes de confianza más altos y creíbles para la extracción, lo que crea más valor para los usuarios de Document Information Extraction.
El nuevo modelo Charmer no solo proporciona una gran precisión de extracción, sino también una menor huella de recursos. Será la base de futuras innovaciones para el procesamiento de documentos debido a su alto potencial de reutilización y extensibilidad.
La nueva versión ya está disponible para todos los clientes que consumen el servicio de extracción de información de documentos directamente y para todos los clientes que usan soluciones de SAP integradas en el servicio de extracción de información de documentos, como la aplicación «Crear pedido de venta – Extracción automática» en la gestión de pedidos de SAP S/4HANA.
Estén atentos y sigan la etiqueta. #Extracción de información del documento para más actualizaciones!
Lea más sobre las noticias de Extracción de Información de Documentos en el portal de ayuda!
Extracción de información del documento es uno de los SAP Servicios empresariales de IA en SAP Business Technology Platform (SAP BTP). Este servicio habilitado para ML está disponible a través de Cloud Platform Enterprise Agreement (CPEA) y también en el modelo Pay-As-You-Go (PAYGO).
Calle Eloy Gonzalo, 27
Madrid, Madrid.
Código Postal 28010
Paseo de la Reforma 26
Colonia Juárez, Cuauhtémoc
Ciudad de México 06600
Real Cariari
Autopista General Cañas,
San José, SJ 40104
Av. Jorge Basadre 349
San Isidro
Lima, LIM 15073