_
_
_
_

El Centro Ramón Piñeiro crea un nuevo corpus del gallego

Los lingüistas podrán usar 20 millones de formas ortográficas

El proyecto de investigación realizado por el Centro Ramón Piñeiro en los últimos años ha permitido crear una nueva versión del Corpus de Referencia del Galego Actual (CORGA) que será de especial utilidad para los investigadores de la lengua gallega. Los lingüistas y el público en general puede acceder a un corpus documental integrado por una colección de cerca de 20 millones de formas ortográficas.

La nueva versión del CORGA fue presentada ayer en Santiago y puede accederse a la misma a través de la página web del Centro Ramón Piñeiro (http://corpus.cirp.es/corgaxml/). El registro en el sistema es gratuito para todo aquel que desee utilizarlo y el único requisito para hacerlo es solicitar una clave de entrada con la que acceder a él.

Se trata de un corpus documental integrado por distintos tipos de textos -diarios, semanarios, revistas, ensayos y textos de ficción- que abarca temporalmente desde el año 1975 hasta la actualidad y que están codificados en el estándar XML (Extensible Markup Language). En esta nueva versión el corpus que se puede consultar se incrementó en seis millones de formas respecto al que hasta ahora estaba disponible. Además, el nuevo CORGA incorpora un nuevo sistema de consulta de la nómina de autores y obras que permite averiguar cuáles son los que están presentes en el corpus.

El máximo responsable de este proyecto, Guillermo Rojo, explicó que el nuevo sistema supone un considerable avance frente al que tenían hasta ahora a su disposición los investigadores de la lengua gallega. "Tiene una especial utilidad para los linguistas que, por ejemplo, pueden comprobar fácilmente cuáles son las preposiciones que suelen seguir a un verbo, pero también puede tener utilidad para otros investigadores como historiadores y sociólogos", indico Rojo.

El proyecto no se detiene con la nueva versión presentada ayer ya que los investigadores del Centro Ramón Piñeiro siguen trabajando para perfeccionar los sistema de búsqueda del CORGA y tratar de incorporar nuevas formas ortográficas para alcanzar la cifra de 25 millones.

La secretaria general de Política Linguísitica, Marisol López, felicitó al centro por poner en marcha una iniciativa que permitirá perfeccionar el trabajo de los investigadores. "Desde este centro se están poniendo a disposición de la sociedad una serie de valiosos recursos y herramientas que, apoyándose en las nuevas tecnologías, permiten un avance exponencial en el conocimiento linguístico", apuntó López.

Tu suscripción se está usando en otro dispositivo

¿Quieres añadir otro usuario a tu suscripción?

Si continúas leyendo en este dispositivo, no se podrá leer en el otro.

¿Por qué estás viendo esto?

Flecha

Tu suscripción se está usando en otro dispositivo y solo puedes acceder a EL PAÍS desde un dispositivo a la vez.

Si quieres compartir tu cuenta, cambia tu suscripción a la modalidad Premium, así podrás añadir otro usuario. Cada uno accederá con su propia cuenta de email, lo que os permitirá personalizar vuestra experiencia en EL PAÍS.

En el caso de no saber quién está usando tu cuenta, te recomendamos cambiar tu contraseña aquí.

Si decides continuar compartiendo tu cuenta, este mensaje se mostrará en tu dispositivo y en el de la otra persona que está usando tu cuenta de forma indefinida, afectando a tu experiencia de lectura. Puedes consultar aquí los términos y condiciones de la suscripción digital.

Archivado En

Recomendaciones EL PAÍS
Recomendaciones EL PAÍS
Recomendaciones EL PAÍS
_
_