Miércoles, 25 Abril 2018

Desarrollan software decodificador de texto a voz

  • Moderna herramienta de comunicación para discapacitados en vías de perfeccionarse

Saltillo, Coahuila.- 4 de febrero de 2017.- (aguzados.com).- Investigadores del Departamento de Ingeniería Eléctrica y Electrónica del Instituto Tecnológico de Saltillo (ITS) —que forma parte del Tecnológico Nacional de México (Tecnm)— desarrollan un software decodificador de texto a voz de bajo costo, para apoyar a personas con discapacidad, con problemas de visión y habla.

voz4feb17a“Fue una integración de tecnologías en una sola interfaz que podamos poner al alcance de la gente, ya que lo único que se necesita es una computadora que tenga sistema operativo Windows y elementos básicos como escáner e impresora”, explicó el maestro en ciencias Luis Javier Mona Peña, maestro adscrito al Departamento de Ingeniera Eléctrica y Electrónica del ITS.

voz4feb17bEste desarrollo surgió como parte de un curso de liderazgo y la detección de una necesidad de impacto social localizada en la Asociación Mexicana de Enfermedades Visuales y Estudios de la Retina, A.C. (AMEVER) Saltillo.

El objetivo del proyecto fue desarrollar una herramienta informática, auxiliar en la comunicación de personas con discapacidad para elevar su calidad de vida, a partir de la necesidad de leer y escribir de usuarios con problemas de visión o de habla, para mejorar su bienestar social.

Para lograr su finalidad, el equipo de investigadores se enfocó en alcanzar metas específicas como: capacidad de interactuar con hardware de bajo costo (escáneres, cámaras, sistemas de audio, etcétera), económicamente accesibles para cualquier persona, funcional en cualquier computadora comercial (sistema operativo Windows) y la integración de tecnologías informáticas como TTS, conversión a braille, OCR, generación de audiolibros, entre otros.

De acuerdo con los datos de la Encuesta Nacional de la Dinámica Demográfica (Enadid) 2014 del Inegi, la prevalencia de la discapacidad en México es de seis por ciento.Los tipos de discapacidad más frecuentes a nivel nacional son: caminar, subir o bajar usando sus piernas (64.1 por ciento) y ver, aunque use lentes (58.4 por ciento) y en el extremo opuesto se ubica la dificultad para hablar o comunicarse (18 por ciento).Las personas con dificultad para ver son las que más asisten a la escuela (42.4 por ciento) entre la población con discapacidad de la población de tres a 29 años. Fuente: Instituto Nacional de Estadística y Geografía(Inegi).

“Es una herramienta de integración de tecnologías, muchas ya existen pero están aisladas. No innova en el aspecto de desarrollar una tecnología nueva, sino que integra diversas herramientas en una sola aplicación y la hace práctica, fácil de usar y de bajo costo, porque puede utilizarse con cualquier computadora”, aclaró el científico Mona Peña.

La implementación del software se realizó por medio de diversas herramientas y programación, siendo las opciones: sistemas de visión con el uso de algoritmos de extracción morfológica, aprendizaje de patrones y su posterior entrenamiento, algoritmos matemáticos para reconocimiento óptico de caracteres (OCR) y referencias de código compilado ActiveX.

En el caso de este desarrollo, se utilizaron referencias ActiveX (Microsoft Speech SDK 5.1 y MODI.I Document), además del generador del módulo de Microsoft Office para LabVIEW 2013 para su integración. Se optó por el uso de la tecnología ActiveX con el propósito de reutilizar código ya compilado tanto del sistema operativo Windows (XP, Vista, 7, 8, 10) y de Microsoft Office (2003, 2007, 2010, 2013), en específico el Microsoft Office Document Imaging.

El sistema operativo Windows trae la opción de Texto a Voz para lo cual utiliza la referencia ActiveX Microsoft Speech SDK 5.1, para la obtención de la lectura computarizada de texto plano. Sin embargo, es incapaz de obtener texto desde imágenes. Para esto, fue empleada la herramienta del Módulo Office Document Imaging MODI.I Document, que permite la extracción de texto de imágenes para su posterior uso o edición.

“El usuario no necesita ser un experto, la interfaz te indica qué tienes que hacer, a través de etapas, para ayudar al usuario a escribir, leer algo, etcétera. La idea es que todo esté en una sola interfaz. De esta manera se puede agarrar un libro, escanearlo o, en su defecto, una imagen ya escaneada o un archivo de texto plano y generar un audiolibro o convertirlo a código braille”, señaló el investigador.

voz4feb17cEl equipo de colaboradores indicó que desean dar a conocer el programa, que sea probado y sea aplicado en diferentes lugares que, por cuestiones económicas, no tengan acceso a software y hardware especializados.

En cuestión tecnológica, los desarrolladores buscarán la integración de voz a texto y, de esta forma, proporcionar mayor independencia al usuario, al no requerir apoyo en actividades como por ejemplo enviar correos electrónicos.

“Otra intención que buscamos es la generación masiva de fuentes bibliográficas en código braille ya que el software puede extraer la información de las fuentes antes mencionadas independientemente del idioma en el que estén escritas y, con una impresora especial, tener la posibilidad de imprimirlas en código braille, para emplearlo en casos como libros difíciles de conseguir o costosos para personas ciegas”, puntualizó el maestro en ciencias Mona Peña.

Contacto: M. en C. Luis Javier Mona Peña.- Maestro adscrito al Departamento de Ingeniera Eléctrica y Electrónica, ITS.- Esta dirección de correo electrónico está siendo protegida contra los robots de spam. Necesita tener JavaScript habilitado para poder verlo.  Teléfono 01 (844) 438 9500.

{ttweet}

Contactanos

logo

Contrata este espacio