Boletín UNAM-DGCS-535
Ciudad Universitaria
Pies de foto al
final del boletín
CREAN UN BUSCADOR DE TÉRMINOS CIENTÍFICOS PARA CREAR SOFISTICADOS DICCIONARIOS COMPUTACIONALES
·
Un programa de términos
científicos a partir de descripciones generales, señaló Gerardo Sierra Martínez,
coordinador del Grupo de Ingeniería Lingüística del Instituto de Ingeniería de
la UNAM
·
Buscan solucionar
problemas centrales sobre el intercambio de información en la sociedad; mejorar
los procesadores y editores de textos; y simplificar las operaciones de
distintas aplicaciones informáticas, informó
Integrantes del Grupo de
Ingeniería Lingüística (GIL) del Instituto de Ingeniería (II) de la UNAM,
desarrollaron un buscador de términos científicos a partir de descripciones
generales, con el que se crearán sofisticados diccionarios computacionales,
informó Gerardo Sierra Martínez, coordinador de ese equipo.
El investigador añadió que de
este proyecto central se han derivado otros acervos, como el de ingeniería y el
histórico del español de México; bancos terminológicos, procesamiento de
textos, extracción de acepciones en artículos de especialidad, resúmenes
automáticos, identificación de las variantes geográficas del léxico en
castellano, y diseño de vocabularios electrónicos, entre otros.
Informó que esta labor pertenece al campo de la
Ingeniería Lingüística (IL), rama de investigación aplicada del Procesamiento
del Lenguaje Natural, enfocada a generar sistemas de cómputo, a fin de
reconocer, interpretar y generar lenguaje humano en todas sus formas.
Sus objetivos son crear
sistemas digitales a partir de lenguaje natural, para comprender, generar,
procesar los códigos comunicativos en todas sus formas. Dentro de sus
principales aplicaciones se encuentra la elaboración de diccionarios, creación
y aplicación de bancos terminológicos, corpus de acepciones, síntesis y
generación de voz y de múltiples utilidades artificiales, especificó.
Con ello se permite una mejor
interacción hombre-máquina, al propiciar que la segunda se adapte a los
usuarios, en el ámbito lingüístico, y no al revés, dijo; busca solución a
problemas centrales sobre el intercambio de información en la sociedad; mejorar
los procesadores y editores de textos; simplificar las operaciones de distintas
aplicaciones informáticas; implementar métodos de seguridad más sofisticados
para la prevención; y crear mecanismos automatizados que permitan la
interacción entre personas con alguna discapacidad, por citar algunos.
El Diccionario Electrónico
para la Búsqueda Onomasiológica lee la información introducida por el
solicitante, identifica las palabras clave en sus bases de datos, genera una
lista de conceptos relacionados y despliega los más probables. Esta tecnología
de punta incorpora elementos de lingüística computacional e inteligencia
artificial.
Expuso un caso que a futuro
podría llegar a ocurrir mediante su evolución, aunque pareciera ciencia
ficción: un turista viaja a Japón y en el aeropuerto compra un sistema de
traducción automática, consistente en lentes, audífonos y bocina. Al llegar hace
uso de ellos luego de conectar los aditamentos. Los letreros los lee en
español, formula preguntas en el idioma nipón, amplificadas por las bocinas, y
escucha lo que dicen los hablantes mediante una conversión automática al castellano.
Creado en 1999 bajo el
liderazgo de Gerardo Sierra, el GIL tiene aplicaciones en lexicografía
computacional, representaciones conceptuales, semántica léxica, diseño y
análisis de corpus textuales, así como minería, recuperación y extracción de
información, recordó.
Al identificar las diversas
áreas en donde interviene la IL, indicó que, en primer lugar, se le debe ubicar
como una parte de la inteligencia artificial. Para su avance requiere de dos
áreas principales: ingeniería en computación y lingüística. Como ámbito propio
se puede mencionar a la bibliotecología y estudios de la información, y la
lingüística aplicada, como terminología, lexicografía y enseñanza de lenguas.
Concluyó que con el manejo de
grandes cantidades de información, que constituye la minería de textos (desde
la recuperación y extracción de información, hasta la inteligencia tecnológica,
pasando por la creación de tesauros y antologías, los resúmenes automáticos,
etcétera), existen dos tipos de usuarios que se verán beneficiados: el personal
no especializado o público en general,
y los especialistas, investigadores y estudiantes.
-0o0-
FOTO 01.
Científicos de la
UNAM desarrollan sofisticados diccionarios computacionales, informó el
investigador Gerardo Sierra Martínez.
FOTO 02
Gerardo Sierra Martínez, del Instituto de Ingeniería de la UNAM, explicó que la Ingeniería Lingüística genera sistemas de cómputo, para reconocer, interpretar y generar lenguaje humano en todas sus formas.