Selecciona Edición
Conéctate
Selecciona Edición
Tamaño letra
Tribuna:FÓRUM DE BARCELONA | Opinión

La lingüística computacional

Del 21 al 26 de julio, la Asociación para la Lingüística Computacional (ACL) celebra su 42º congreso anual en el seno del Fórum 2004 de Barcelona, tras haber visitado Filadelfia en 2002 y Sapporo en 2003. Se trata de un evento académico de primera magnitud, ya que la ACL es la única asociación mundial que agrupa a investigadores y otros especialistas en lingüística computacional.

La lingüística computacional es una disciplina nueva, que se ha ido abriendo camino en el mundo académico occidental, sobre todo en los países que tienen una organización universitaria más flexible que la nuestra. Es un campo esencialmente interdisciplinario, en el que convergen contenidos y metodologías provenientes del ámbito de las letras (lingüística, traducción, filosofía) con otros que proceden de las ciencias formales (matemáticas) y la tecnología (informática, telecomunicaciones). Se trata, pues, de un ejemplo de esa relación transversal entre las humanidades y la ciencia y la tecnología que resulta tan necesaria en nuestro mundo actual, altamente tecnificado, y que se encuentra de forma sólo muy escasa en el contexto académico. En concreto, se integran en la lingüística computacional los métodos de análisis del lenguaje humano con la teoría y las técnicas de la computación, de forma que se combinan las intuiciones y conocimientos lingüísticos con las técnicas de representación, transmisión, procesamiento y recuperación de datos lingüísticos digitalizados.

Entre las técnicas más habituales de la lingüística computacional destacamos: el análisis del lenguaje, para obtener, a partir de textos y habla, representaciones de la estructura y el significado de las oraciones que los integran; la generación del lenguaje, para crear textos y hablar a partir de contenidos almacenados en diversos formatos (bases de datos, esquemas conceptuales, protocolos, etcétera); las técnicas de representación de información lingüística, tanto del significado explícito como del implícito; las técnicas de almacenaje y recuperación de información estructurada en tiempo real (es decir, en tiempos parecidos a los que usamos los humanos para escuchar, comprender, responder a los mensajes lingüísticos que manejamos).

Naturalmente, estas técnicas están en la base de muchos productos que son útiles a la sociedad, como por ejemplo: la traducción de textos o del habla; la producción automática de textos (escritos u orales), por ejemplo para la creación de boletines informativos (meteorológicos, de bolsa, de tráfico, etcétera); la recuperación precisa de información en entornos monolingües o multilingües, como Internet, para obtener exactamente las informaciones deseadas, independientemente de la lengua en que estén expresadas; la interacción persona-máquina, permitiendo la comunicación lingüística (preferentemente oral), en sustitución de los clásicos menús de los ordenadores; así como un montón de otras aplicaciones menores, pero igualmente útiles: dictáfonos, menús de gestión oral, identificación de personas por la voz, correctores de textos (ortográficos, gramaticales y de estilo), herramientas de apoyo a la enseñanza, diccionarios y enciclopedias consultables de maneras distintas al habitual orden alfabético, sistemas de apoyo a las actividades profesionales de traductores, técnicos lingüísticos, gestores de conocimientos, etcétera. Este rápido listado de aplicaciones muestra que los resultados prácticos de esta investigación pueden mejorar el acceso a la información codificada en una lengua concreta y su gestión. Dado que, en su evolución, la humanidad ha convenido en que la mejor forma de gestionar la información es mediante el lenguaje, el progreso en el área del procesamiento del mismo repercute directamente en la vida de los ciudadanos. Y dado que las lenguas, que forman parte del patrimonio lingüístico de la humanidad, se cuentan por miles, la aplicación de estas técnicas a un número de lenguas lo más amplio posible deberá redundar en beneficio del mantenimiento del multilingüismo en la humanidad. De esta manera, a la vez que se promueve la mejora en la capacidad de gestión de la información de los habitantes de los países occidentales, se podrá facilitar también que accedan a la información personas y sociedades enteras que hasta ahora han estado apartados de los progresos científicos y sociales. Claro está, esto será posible siempre que se evite el uso nocivo de las técnicas investigadas, como podría ser, por ejemplo, la potenciación de unas pocas lenguas "de poder" frente a las demás.

El comité organizador del 42º congreso de la ACL integra investigadores de cinco universidades catalanas (Universidad Autónoma de Barcelona, Universidad de Barcelona, Universidad Politécnica de Cataluña, Universidad Pompeu Fabra y Universidad Ramon Llull). En todas ellas existen grupos de I+D en lingüística computacional, a menudo interdisciplinarios. Y la oferta formativa actual es importante: se imparte la licenciatura de lingüística en la UB y en la UPF (esta última programada conjuntamente por un departamento de letras y un departamento de tecnología) y los distintos centros imparten varios cursos de doctorado y de posgrado. Todo esto permite afirmar que la investigación y la formación especializada en lingüística computacional en Cataluña goza de buena salud y posee el dinamismo necesario para ocupar un lugar puntero en la escena internacional.

Toni Badia es director del diálogo Comunicación y lenguaje en la era digital.

* Este artículo apareció en la edición impresa del Miércoles, 21 de julio de 2004