ReadIRIS: OCR a nivel profesional

En este momento, el mercado de los OCR está en alza … y es cada día un tipo de aplicación más necesaria a todos los niveles de la industria, la empresa, y lo que es mas importante, la educación y documentación. La recuperación de documentación impresa para su almacenado y consulta digital es hoy en día una industria emergente de alto nivel en la que IRIS sitúa este gran producto.

Si no vamos más allá de poder recuperar el texto de una o dos páginas impresas al año, posiblemente estaremos infrautilizando este software concebido como una plataforma profesional de importación de datos impresos que requiere de cierta dedicación para obtener los mejores resultados. Es una herramienta flexible, pensada para dar muchas opciones al operador y permitir la incorporación de los datos de la forma mas precisa posible. Y si en alguna ocasión probaste otro OCR y no quedaste muy satisfecho con los resultados, este software supone un alivio y la seguridad de que realiza lo que promete y lo hace de forma muy correcta.

readiris1.jpg
Click para ampliar

Si tienes una empresa y necesitas recuperar de forma digital (o incluso quieres ofrecer este tipo de servicio), ReadIRIS es la herramienta necesaria.

OCR

El software de reconocimiento óptico de caracteres, abreviado habitualmente como OCR (Optical character recognition), extrae de una imagen los caracteres que componen un texto para almacenarlos en un formato con el cual puedan interactuar programas de edición de texto.

Mientras que en una imagen los caracteres se describen indicando cada uno de los puntos que los forman, al convertirlos a un formato de texto (por ejemplo ASCII o Unicode), pasan a estar descritos por un solo número, por lo que se produce una reducción significativa del espacio en memoria que ocupan.

A partir de ahí el texto es reconocido como texto, de modo que se pueden buscar en él cadenas de caracteres, exportar el texto a un editor de textos, o a otras aplicaciones, etc.

Actualmente, junto con el texto, se registra también el formato con el que ha sido escrito. [Wikipedia].

Como funciona el proceso

Cuando abrimos ReadIRIS; nos encontraremos con una pantalla como esta:

Donde tendremos las siguientes opciones:

  1. La Barra de herramientas con las diferentes opciones

  2. La activación de un flujo automático de trabajo de manera que con unas preferencias determinadas lo convierta en documento o pdf, o incluso lo envíe directamente a una aplicación.

  3. El menú de apertura de archivos:

    • Archivo

    • Un submenú para tratar el documento incluido como una imagen (para exportarla como tal)

    • Diferentes opciones de configuración que incluyen el eliminado de ruido de la imagen, Detección de la orientación de la página y mas.
  4. El menú de reconocimiento con sus diferentes opciones:

    • Selección de Idioma (del texto a reconocer)

    • Autoaprendizaje: muy interesante activarlo durante la primera temporada que utilice el software, ya que así este aprenderá a reconocer mejor caracteres y ser mas eficiente.

    • Documento de salida. Por defecto, RTF, aunque puede ser modificado.

Modificación de el tipo de documento de salida

En el menú Configuración > Formato de texto se encuentran las diferentes opciones de exportación de texto de ReadIRIS, destacando dos de sus opciones mas interesantes: aparte de guardar en formato PDF, RTF y Unicode, también lo hace directamente en HTML y lo puedo enviar a otras aplicaciones, como por ejemplo Word (donde los RTF que genera se ven mas correctamente que en Vista previa, donde no se ven las imágenes), para poder seguir trabajando en el documento una vez extraído su texto.

¿Realmente “acierta” tanto?

La verdad es que acertar es un término poco correcto: el reconocimiento es muy rápido (G5 2,3 GHz Dual) y con el autoaprendizaje los errores se corrigen aún mas deprisa, y el resultado es en un porcentaje elevadisimo, muy aceptable. El texto (incluso en escritos a mano) es reconocido. Es recomendable echar siempre un vistazo final al documento antes de darlo por válido, pero una simple pasada del corrector ortográfico descubriremos si ha habido algún error de reconocimiento que se nos ha pasado.

readiris2.jpg
Click para ampliar

Corrección a disposición del usuario

No todos los documentos son iguales y muchos de ellos necesitan ser tratados individualmente para poder realizar un reconocimiento con total éxito. En la barra de herramientas disponemos de una serie de herramientas para realizar reconocimientos mucho más profundos y establecer órdenes y más.

Lo mejor

  • Reconoce textos escritos aun en situaciones algo extremas

  • Buenas opciones para reconocimiento, incluyendo la posibilidad de eliminar ruido de las imágenes

  • Reconoce textos de una gran variedad de idiomas

  • Variados formatos de exportación

  • Es Binaria Universal (Macs con PPC o Intel)
  • Lo peor

  • El interface despista un poco

  • No permite arrastrar un documento directamente a la ventana (es necesario “abrir”)

  • La traducción a castellano cuenta con algún que otra “expresión peculiar” como “anular” por “cancelar”.
  • ReadIRIS Pro tiene un precio de 152 Euros. Más información en la página del producto en IRIS

    0 0 votos
    Article Rating
    Subscribe
    Notify of
    0 Comments
    Opiniones Inline
    Ver todos los comentarios
    0
    Me encantaría saber tu opinión, por favor, deja un comentariox
    ()
    x