_
_
_
_

La Real Academia informatizará 200 millones de palabras

El trabajo permitirá conocer las voces de uso común en España e Hispanoamérica

La Real Academia Española ha emprendido una nueva etapa de modernización con la creación del Corpus de Referencia del Español Actual (CREA), gracias a un convenio firmado ayer con el Ministerio de Educación. En dos años tienen previsto crear una base de datos de 100 millones de palabras que se doblará hasta el año 2000. Este corpus incluirá palabras de uso común del castellano en España y Latinoamérica, incluidas las que no han sido aceptadas en el diccionario de la RAE. El proyecto costará 1.025 millones de pesetas.

Un equipo de cerca de cincuenta lexicógrafos se encuentra ya marcando todo tipo de textos para proporcionar a investigadores especializados y cualquier tipo de persona o empresa interesada, una visión completa del castellano que se usa actualmente en la literatura, los medios de comunicación y el habla común."El idioma está hecho para deteriorarse y para evolucionar", dijo ayer el director de la Academia, Fernando Lázaro Carreter, "este corpus proporcionará un valioso material con el que trabajar".

El trabajo está empezando prácticamente desde cero, aunque se cuenta con los ficheros de la Academia y la colaboración de las delegaciones en los países latinoamericanos. Juan Carlos Conde, uno de los responsables del proyecto, explicó que se están usando textos desde 1975 hasta 1997 en la primera etapa, que incluirá 100 millones de palabras, con un 50% de España y el otro 50% de los otros países hispanohablantes. "El CREA viene a cubrir un hueco con respecto a otras lenguas, como el alemán, el italiano o el inglés, que ya tienen hace años un corpus con el que trabajar. Será una herramienta, un gran recurso para la ingeniería lingüística. Se incluirán todo tipo de palabras, incluso los errores más extendidos del uso de la lengua ' porque ellos pueden llegar a constituir con el tiempo las palabras de uso aceptadas".

"Se trata de saber cuáles son las palabras que más se usan actualmente y cuáles están desechadas. Esta base de datos no tendrá una fuerza normativa, sino simplemente descriptiva", aclaró.

El convenio firmado ayer con el Ministerio de Educación, a través del Secretario de Estado de Universidades e Investigación, Enric Banda, prevé un presupuesto de 1.025 millones de pesetas.

El Ministro de Educación, Jerónimo Saavedra, manifestó que el español es una de las lenguas en expansión. "El vigor de nuestro idioma en sitios como Estados Unidos, está fuera de entredicho. Sólo en el campo técnico vemos una fuerte amenaza".

Lázaro Carreter piensa que este corpus permitirá mantener la unidad de la lengua. "Tenemos la necesidad de acercarnos a todos los hispanohablantes. La Academia no solo defiende la pureza y el casticismo, con el lema limpia, fija y da esplendor, sino que ahora trabaja para llegar a todos los que la hablan y la usan a su manera. En tres años prevé aportar con este trabajo unos códigos más perfectos y una gramática de uso que podrán aprovechar, por ejemplo, las editoriales para hacer nuevos diccionarios".

Los textos, introducidos en el ordenador mediantes escáner y programas de reconocimiento óptico, están estructurados en varias áreas temáticas: ciencia y tecnologías; ciencias sociales, creencias y pensamiento; política, economía, comercio y finanzas; artes; ocio, vida cotidiana, medicina, nutrición, higiene pública y ficción.

El 45% del contenido del CREA procederá de libros; otro 45% de periódicos y revistas, y el 10% restante se obtendrá de folletos, propaganda, correspondencia comercial y privada y hasta llamadas telefónicas, autorizadas por los interlocutores.

Toda la cultura que va contigo te espera aquí.
Suscríbete

Babelia

Las novedades literarias analizadas por los mejores críticos en nuestro boletín semanal
RECÍBELO

Tu suscripción se está usando en otro dispositivo

¿Quieres añadir otro usuario a tu suscripción?

Si continúas leyendo en este dispositivo, no se podrá leer en el otro.

¿Por qué estás viendo esto?

Flecha

Tu suscripción se está usando en otro dispositivo y solo puedes acceder a EL PAÍS desde un dispositivo a la vez.

Si quieres compartir tu cuenta, cambia tu suscripción a la modalidad Premium, así podrás añadir otro usuario. Cada uno accederá con su propia cuenta de email, lo que os permitirá personalizar vuestra experiencia en EL PAÍS.

En el caso de no saber quién está usando tu cuenta, te recomendamos cambiar tu contraseña aquí.

Si decides continuar compartiendo tu cuenta, este mensaje se mostrará en tu dispositivo y en el de la otra persona que está usando tu cuenta de forma indefinida, afectando a tu experiencia de lectura. Puedes consultar aquí los términos y condiciones de la suscripción digital.

Archivado En

Recomendaciones EL PAÍS
Recomendaciones EL PAÍS
Recomendaciones EL PAÍS
_
_