06:00 hrs.  13 de Julio de 2005

 

 

Boletín UNAM-DGCS-535

Ciudad Universitaria

 

Pies de foto al final del boletín

 

 

CREAN  UN BUSCADOR DE TÉRMINOS CIENTÍFICOS PARA CREAR SOFISTICADOS DICCIONARIOS COMPUTACIONALES

 

·        Un programa de términos científicos a partir de descripciones generales, señaló Gerardo Sierra Martínez, coordinador del Grupo de Ingeniería Lingüística del Instituto de Ingeniería de la UNAM

·        Buscan solucionar problemas centrales sobre el intercambio de información en la sociedad; mejorar los procesadores y editores de textos; y simplificar las operaciones de distintas aplicaciones informáticas, informó

 

Integrantes del Grupo de Ingeniería Lingüística (GIL) del Instituto de Ingeniería (II) de la UNAM, desarrollaron un buscador de términos científicos a partir de descripciones generales, con el que se crearán sofisticados diccionarios computacionales, informó Gerardo Sierra Martínez, coordinador de ese equipo.

 

El investigador añadió que de este proyecto central se han derivado otros acervos, como el de ingeniería y el histórico del español de México; bancos terminológicos, procesamiento de textos, extracción de acepciones en artículos de especialidad, resúmenes automáticos, identificación de las variantes geográficas del léxico en castellano, y diseño de vocabularios electrónicos, entre otros.

 

Informó que esta labor pertenece al campo de la Ingeniería Lingüística (IL), rama de investigación aplicada del Procesamiento del Lenguaje Natural, enfocada a generar sistemas de cómputo, a fin de reconocer, interpretar y generar lenguaje humano en todas sus formas.

 

Sus objetivos son crear sistemas digitales a partir de lenguaje natural, para comprender, generar, procesar los códigos comunicativos en todas sus formas. Dentro de sus principales aplicaciones se encuentra la elaboración de diccionarios, creación y aplicación de bancos terminológicos, corpus de acepciones, síntesis y generación de voz y de múltiples utilidades artificiales, especificó.

 

Con ello se permite una mejor interacción hombre-máquina, al propiciar que la segunda se adapte a los usuarios, en el ámbito lingüístico, y no al revés, dijo; busca solución a problemas centrales sobre el intercambio de información en la sociedad; mejorar los procesadores y editores de textos; simplificar las operaciones de distintas aplicaciones informáticas; implementar métodos de seguridad más sofisticados para la prevención; y crear mecanismos automatizados que permitan la interacción entre personas con alguna discapacidad, por citar algunos.

 

El Diccionario Electrónico para la Búsqueda Onomasiológica lee la información introducida por el solicitante, identifica las palabras clave en sus bases de datos, genera una lista de conceptos relacionados y despliega los más probables. Esta tecnología de punta incorpora elementos de lingüística computacional e inteligencia artificial. 

 

Expuso un caso que a futuro podría llegar a ocurrir mediante su evolución, aunque pareciera ciencia ficción: un turista viaja a Japón y en el aeropuerto compra un sistema de traducción automática, consistente en lentes, audífonos y bocina. Al llegar hace uso de ellos luego de conectar los aditamentos. Los letreros los lee en español, formula preguntas en el idioma nipón, amplificadas por las bocinas, y escucha lo que dicen los hablantes mediante una conversión automática al  castellano.

 

Creado en 1999 bajo el liderazgo de Gerardo Sierra, el GIL tiene aplicaciones en lexicografía computacional, representaciones conceptuales, semántica léxica, diseño y análisis de corpus textuales, así como minería, recuperación y extracción de información, recordó.

 

 

 

Al identificar las diversas áreas en donde interviene la IL, indicó que, en primer lugar, se le debe ubicar como una parte de la inteligencia artificial. Para su avance requiere de dos áreas principales: ingeniería en computación y lingüística. Como ámbito propio se puede mencionar a la bibliotecología y estudios de la información, y la lingüística aplicada, como terminología, lexicografía y enseñanza de lenguas.

 

Concluyó que con el manejo de grandes cantidades de información, que constituye la minería de textos (desde la recuperación y extracción de información, hasta la inteligencia tecnológica, pasando por la creación de tesauros y antologías, los resúmenes automáticos, etcétera), existen dos tipos de usuarios que se verán beneficiados: el personal no especializado  o público en general, y los especialistas, investigadores y estudiantes.

 

-0o0-




 

 

FOTO 01.

Científicos de la UNAM desarrollan sofisticados diccionarios computacionales, informó el investigador Gerardo Sierra Martínez.

 

FOTO 02

Gerardo Sierra Martínez, del Instituto de Ingeniería de la UNAM, explicó que la Ingeniería Lingüística genera sistemas de cómputo, para reconocer, interpretar y generar lenguaje humano en todas sus formas.