ArchivoEdición impresa

Acceso a suscriptores »

Accede a EL PAÍS y todos sus suplementos en formato PDF enriquecido

martes, 18 de noviembre de 2003
Aulas

Filólogos codifican seis millones de palabras

La Universidad de Jaén analiza textos del Siglo de Oro para un diccionario de la RAE

Sentar las bases del diccionario histórico de la Real Academia de la Lengua Española (RAE) es uno de los objetivos de un equipo de filólogos de la Universidad de Jaén que, desde el pasado mes de marzo, trabaja en la codificación de seis millones de palabras procedentes de textos del segundo período del Siglo de Oro de la Literatura española.

La poesía de los hermanos Argensola o las Crónicas de Indias son algunas de las obras que ya forman parte del Corde (Corpus Diacrónico del Español) que es la base de datos del futuro diccionario histórico de la lengua española, "uno de los grandes proyectos de la RAE", señala Ignacio Ahumada, lexicógrafo y director del grupo de investigación.

"Ahora, a través de Internet (www.rae.es) se puede consultar la palabra buscada dentro del contexto en el que fue utilizada por los escritores de las obras seleccionadas, pero cuando finalice este trabajo preparatorio, se estará en condiciones de elaborar el diccionario histórico del español", explica el profesor Ahumada.

En total, el diccionario histórico se nutrirá de cerca de 300 millones de palabras procedentes de textos, no sólo poéticos o narrativos sino también históricos y periodísticos, seleccionados por la RAE, y entre los que se encuentran desde las primeras manifestaciones escritas del español en la Edad Media, hasta las obras escritas y la prensa anterior a 1974.

El segundo periodo del Siglo de Oro, entre 1599 y 1713, es el que ocupa a los jóvenes filólogos de la UJA que hasta el momento han volcado en el Corde los textos en los que se encuentran cerca de tres millones de palabras de los seis millones encargados por la RAE.

Los investigadores reciben, digitalizadas, las obras que han sido seleccionadas por la RAE y codifican estos textos, tras comprobar su fidelidad con el manuscrito original fotocopiado, según el sistema internacional del programa informático SGML. "Se trata de un trabajo laborioso y que requiere ser un especialista del español del Siglo de Oro para descubrir posibles errores en la grafía, que son frecuentes a la hora de transcribir las obras al soporte informático", subraya Ignacio Ahumada.

El convenio firmado entre la RAE y la Universidad de Jaén tiene su origen en la reconocida tradición lexicográfica de esta universidad que se materializa cada dos años en el seminario sobre Lexicografía Hispánica, que se organiza desde 1990.

"La UJA acoge un foro científico internacional con la presencia de los investigadores más relevantes que actualmente están trabando en diferentes diccionarios", explica el profesor Ahumada. La próxima edición de este foro, que se celebrará del 19 al 21 de noviembre, se dividirá en dos grandes bloques: la lexicografía del español en América y la lexicografía regional andaluza.

Atención al cliente

Teléfono: 902 20 21 41

Nuestro horario de atención al cliente es de 9 a 14 los días laborables

Formulario de contacto »

Lo más visto en...

» Top 50

Webs de PRISA

cerrar ventana