Reconocimiento optico de caracteres (OCR)



1) Ejemplo


Un correo recibido...


problema

¿Qué podemos recomendarle...?


2) Concepto

Un sistema menos futurista que el anterior es la aplicación de programas de reconocimiento óptico de caracteres a los formularios de empresa como albaranes, pedidos o facturas. El software incluye el escaneado de los documentos, la interpretación del contenido, verificación y gestión.

Estos programas suelen funcionar sobre la base de reconocimiento de patrones utilizando tecnologías como redes neuronales artificiales, una rama de la Inteligencia Artificial que logra el aprendizaje a partir de patrones o ejemplos.

Internamente son modelos matemáticos multivariantes que utilizan procedimientos iterativos, en general para minimizar funciones de error por ajuste de parámetros.


Reconocimiento óptico de caracteres en formularios de empresa mediante redes neuronales artificiales

FUENTE: José Ramón Dorronsoro Ibero, Instituto de Ingeniería del Conocimiento de la Universidad Autónoma de Madrid (http://www.iic.uam.es)


A pesar de la tantas veces anunciada Compañía Sin Papel, la información escrita sigue teniendo una presencia cada vez mayor en la empresa. Un ejemplo particularmente relevante de este hecho son los formularios: los albaranes de pedidos, las relaciones de inventarios, o la información personal se recogen sobre formularios específicos, para su proceso posterior.

RAMA32, una herramienta OCR desarrollada en el Instituto de Ingeniería del Conocimiento y orientada específicamente a la captura de información en formularios, tanto manuscrita como impresa o marcas de selección, ofrece en el familiar entorno de las aplicaciones Windows, un medio eficaz de aprovechar dichas ventajas y complementarlas con otras, como una fácil explotación desasistida, un potente sistema de videocorrección, o la posibilidad de incorporar todo tipo de diccionarios o listas de control.

El objetivo es simplificar al máximo la captura de información manuscrita en todo tipo de formularios. Con RAMA32, empresas tales como El Corte Inglés, Reebok, el Ministerio de Educación y Ciencia, o Prosegur, han resuelto el problema de la captura de datos en formularios, con una relación coste/beneficio excelente.



3) Software

Software de contabilidad que contabiliza de forma automática facturas previamente escaneados, Contarapid (http://www.vimeo.com/2840330) y (http://www.incarsoft.com/index.php). El procedimiento que sigue Contarapid consiste en escanear las facturas, con lo que ya se genera el gestor documental para luego utilizarlo, y tras ello exportar el asiento contable al programa contable de la empresa. Los propios teléfonos móviles disponen de OCR para facilitar esta tarea, como vemos en el siguiente vídeo.

 

 


El problema son los diferentes formatos....


Se han desarrollado algunos proyectos para ayudar a la estandarización de las facturas de papel, como UNeDocs de United Nations Centre for Trade Facilitation and Electronic Business (http://www.unece.org/cefact/) Esto sirve para facilitar las cosas a los OCR. Veamos un ejemplo de rediseño de facturas en Chgblog (http://www.chgblog.com/rediseno-de-factura-mejorando-la-comunicacion/) o en (http://www.consulting.xerox.com/resultados/aliant/espy.html) [vídeo en inglés].

 

Ficha Técnica
Título: Reconocimiento optico de caracteres (OCR)
Autor:
Idioma: es
Publicado:
Modificado: 29 Enero 2012
Resumen: Se describe la utilización del reconocimiento óptico de caracteres en la captura de datos contables, especialmente útil para escanear facturas e introducirlas en el sistema de información contable
Palabras clave: OCR,reconocimiento óptico de caracteres, facturas
Licencia: Creative Commons (Reconocimiento 3.0 Genérica)

Formatos: [Versión para imprimir] [Versión en PDF]
Foto de Carlos Serrano-Cinca
es Profesor en la Universidad de Zaragoza. Su web personal:
Citar como: Carlos Serrano-Cinca (2012) :"Curso Online sobre Gestión Electrónica de Empresas" http://ciberconta.unizar.es/ecofin/drupal1/reconocimiento-optico-caracteres-ocr [Fecha de consulta: 29 Enero 2012]

La clase continua en Facebook: