_
_
_
_
_

La Academia presenta un inmenso banco de datos que recoge la historia del español

90 millones de formas de textos escritos podrán ser consultadas por Internet en octubre

Miguel Ángel Villena

La Real Academia Española ha pasado de contar con 12 millones de fichas artesanales a más de 120 millones de registros electrónicos. Así se resume el camino emprendido por la institución para no perder el tren de la informática. En tres años, el español contará con un inmenso banco de datos comparable al de otros grandes idiomas. A partir de octubre, 90 millones de formas de textos escritos ya podrán ser consultadas por Internet. El director de la Academia, Fernando Lázaro Carreter, señaló ayer ante 200 profesores que "la informatización es la vía para ganar batalla de la unidad del idioma"

.Como "tesoros artísticos" definió ayer el responsable de la Real Academia Española muchas de las fichas rellenadas durante los siglos XVIII y XIX. Pero, lamentablemente, la mayoría de estas joyas artesanales está salpicada de errores e imperfecciones. Aunque no hace falta remontarse tanto en el tiempo para comprender la gigantesca transformación que ha sufrido el almacenamiento del idioma. Cuando Lázaro Carreter acudía como estudiante o como joven profesor a trabajar en las salas de la Academia, los encargados de cumplimentar las fichas cobraban 40 céntimos por cada una. Cualquier visitante observa hoy el contraste entre la solemnidad de las planas altas del edificio y el bullicio informático de otras salas del centro.

Como admitía Victor García de la Concha, secretario de la institución, dos mundos conviven en la actualidad con un mismo objetivo: mantener la riqueza y la unidad de un idioma hablado por más de 300 millones de personas. "Preservar la unidad del idioma en un mundo tan cambiante", proclamó el secretario ante los 200 profesores procedentes de 45 universidades españolas, "es hoy tan importante como el viejo lema de 'limpia, fija y da esplendor".

Tanto Fernando Lázaro Carreter como Víctor García de la Concha insistieron en la idea de la unidad idiomática ante las amenazas de disgregación en una sociedad cada día más tecnificada. Asimismo, destacaron que la Academia ha de contar con dos armas fundamentales: un diccionario y una gramática que sean reconocidos como normas por todos los hispanohablantes. "La coincidencia de todos los países en la ortografía es lo que ha permitido mantener la unidad del idioma", apostilló el director.

Variantes dialectales

Frente a algunas reticencias que estas iniciativas españolas despiertan en América y frente al eterno pulso entre la unidad y las variantes dialectales que plantea cualquier lengua, Lázaro Carreter se mostró tajante: "Hablamos una misma lengua pero, además, todas las diferencias estarán recogidas en el banco de datos". El mexicano Raúl Dávila, por ejemplo, pidió una mayor representación de las variantes del español en los veinte países americanos independientes desde el siglo XIX.

El Corpus de Referencia del Español Actual (CREA), que ayer fue presentado en sociedad que ha ocupado a unas 65 personas en su elaboración durante los últimos tres años, comprende los últimos 25 años e incluye textos españoles y americanos al 50%. El material recogido procede de libros, revistas, periódicos y textos orales y sus temas abarcan desde la ciencia a la política, desde la cultura a la vida cotidiana. Las tareas de elaboración del CREA y del Corpus Diacrónico del Español (CORDE) -que recoge desde los inicios del idioma hasta 1975- se prolongarán durante otros tres años y cuentan con un presupuesto de 160 millones de pesetas, de los que 120 los aporta el Gobierno y el resto la Academia.

Junto a los cerca de dos centenares de profesores universitarios de español, miembros de la Real Academia acudieron ayer a la apertura de estas jornadas de presentación del Corpus de Referencia del Español Actual. También figuraban entre los invitados representantes del Instituto Cervantes, del Consejo Superior de Investigaciones Científicas y de las academias de las otras tres lenguas habladas en España: la Real Academia de la Lengua Gallega, la Real Academia de la Lengua Vasca y el Institut d'Estudis Catalans.

Tras la presentación institucional de las jornadas, a cargo de Lázaro Carreter, el profesor Guillermo Rojo, responsable de la elaboración del banco de datos, destacó que el Corpus ha de ser "representativo y equilirado". Rojo agregó que ya han sido codificados 90 millones de formas de textos escritos y unos cuatro millones de formas de textos orales. Las jornadas, que concluyen hoy, compaginan las exposiciones generales sobre la formación del banco de datos con demostraciones de los distintos pasos de construcción de este "inmenso diccionario", como lo calificó Fernando Lázaro Carreter.

Toda la cultura que va contigo te espera aquí.
Suscríbete

Babelia

Las novedades literarias analizadas por los mejores críticos en nuestro boletín semanal
RECÍBELO

Regístrate gratis para seguir leyendo

Si tienes cuenta en EL PAÍS, puedes utilizarla para identificarte
_

Archivado En

Recomendaciones EL PAÍS
Recomendaciones EL PAÍS
Recomendaciones EL PAÍS
_
_