El IEC concluye el Corpus Textual, una inmensa base de 52 millones de palabras
Han sido necesarios 13 años y 900 millones de pesetas para realizar una de las obras más faraónicas emprendidas por la lingüística europea: una base de datos que recoja todas las palabras existentes y que han existido en la lengua catalana. La finalización del Corpus Textual Informatitzat de la Llengua Catalana, para el que el IEC ha empleado a dos centenares de personas al mando de Joaquim Rafel, también significa el punto de partida de la segunda parte del proyecto: la elaboración del Diccionari del català contemporani.
El Corpus, como lo conocen en el IEC, es una inmensa base de datos construida a partir del vaciado de 3.300 textos catalanes, tanto literarios como de cualquier otro tipo: tratados científicos, disposiciones administrativas, periódicos, correspondencia, ensayos filosóficos e incluso ejemplares del Diari Oficial de la Generalitat. En total, 52.250.000 unidades lingüísticas, o también 148.000 palabras distintas combinadas en infinidad de frases y párrafos. Los textos seleccionados fueron publicados entre 1833 (año de aparición de la oda La pàtria, de Aribau) y 1988. Es decir, desde la recuperación del catalán como lengua de cultura, tras el largo periodo de decadencia, hasta la actualidad. Algo comparable al magno Diccionari etimològic de Joan Coromines, pero con cables y pantallas en vez de chirucas y papel. "En realidad, como tarea profesional no tiene mucho que ver", señala Joaquim Rafel, catedrático de Filología Catalana de la Universidad de Barcelona y director del Corpus, "porque el trabajo de Coromines dependía mucho de factores ajenos a la lexicografía. Los avances tecnológicos permiten un estudio menos intuitivo y más objetivo, y ahí está el gran valor del Corpus: superar las limitaciones de las antiguas técnicas de confección de diccionarios, que perpetuaban los errores de los precedentes ya que solían basarse en ellos". Tanto por sus características como por el soporte (exclusivamente electrónico, sin versión en papel), el Corpus Textual es un instrumento de trabajo sobre todo para estudiosos y universidades, que pueden consultarlo a través de la red del propio IEC o bien por Internet con cualquier navegador convencional. Para Rafel, "es obvio que los más interesados serán los departamentos de catalán de todas las cátedras del mundo, aunque a nadie se le impedirá el acceso. A cualquier persona que solicite una clave a la Sección Filológica se le dará acceso a toda la información". El Corpus, que por sus dimensiones sólo tiene, según Rafel, un equivalente en toda Europa (realizado en Francia), se ha llevado a cabo en tres fases: de 1985 a 1988, definición y puesta en marcha del proyecto con presupuesto exclusivamente a cargo del IEC; del 88 al 91, convenio con el Ministerio de Universidades e Investigación, que permitió la informatización total y la contratación de los primeros 60 becarios, procedentes de la Universidad de Barcelona y de la Autónoma, y del 94 al 97, un segundo convenio, esta vez con el Ministerio de Educación y Cultura, más la Generalitat, con el cual se ha concluido la obra. Manuel Castellet, presidente del IEC, anunció ayer, en el acto de presentación del trabajo, que ya está a punto de firma un tercer convenio con ambas instituciones para llevar adelante la redacción del citado Diccionari del català contemporani. Este diccionario, de carácter descriptivo (no fija normas sino, que describe la realidad lingüística), está previsto para el 2004. En el horizonte, la Sección Filológica ya entrevé la sombra de la definitiva culminación de todos estos trabajos, que no es otra que un diccionario normativo que podría poner fin a las cíclicas polémicas sobre la autoridad del IEC en este campo. Joaquim Rafel aventura la fecha del año 2010 y asegura que, "en cualquier caso, será un diccionario de nueva planta, sin nada que ver con el de Fabra ni con ningún otro".
Tu suscripción se está usando en otro dispositivo
¿Quieres añadir otro usuario a tu suscripción?
Si continúas leyendo en este dispositivo, no se podrá leer en el otro.
FlechaTu suscripción se está usando en otro dispositivo y solo puedes acceder a EL PAÍS desde un dispositivo a la vez.
Si quieres compartir tu cuenta, cambia tu suscripción a la modalidad Premium, así podrás añadir otro usuario. Cada uno accederá con su propia cuenta de email, lo que os permitirá personalizar vuestra experiencia en EL PAÍS.
En el caso de no saber quién está usando tu cuenta, te recomendamos cambiar tu contraseña aquí.
Si decides continuar compartiendo tu cuenta, este mensaje se mostrará en tu dispositivo y en el de la otra persona que está usando tu cuenta de forma indefinida, afectando a tu experiencia de lectura. Puedes consultar aquí los términos y condiciones de la suscripción digital.