_
_
_
_
_

El Centro Ramón Piñeiro crea un nuevo corpus del gallego

Los lingüistas podrán usar 20 millones de formas ortográficas

El proyecto de investigación realizado por el Centro Ramón Piñeiro en los últimos años ha permitido crear una nueva versión del Corpus de Referencia del Galego Actual (CORGA) que será de especial utilidad para los investigadores de la lengua gallega. Los lingüistas y el público en general puede acceder a un corpus documental integrado por una colección de cerca de 20 millones de formas ortográficas.

La nueva versión del CORGA fue presentada ayer en Santiago y puede accederse a la misma a través de la página web del Centro Ramón Piñeiro (http://corpus.cirp.es/corgaxml/). El registro en el sistema es gratuito para todo aquel que desee utilizarlo y el único requisito para hacerlo es solicitar una clave de entrada con la que acceder a él.

Se trata de un corpus documental integrado por distintos tipos de textos -diarios, semanarios, revistas, ensayos y textos de ficción- que abarca temporalmente desde el año 1975 hasta la actualidad y que están codificados en el estándar XML (Extensible Markup Language). En esta nueva versión el corpus que se puede consultar se incrementó en seis millones de formas respecto al que hasta ahora estaba disponible. Además, el nuevo CORGA incorpora un nuevo sistema de consulta de la nómina de autores y obras que permite averiguar cuáles son los que están presentes en el corpus.

El máximo responsable de este proyecto, Guillermo Rojo, explicó que el nuevo sistema supone un considerable avance frente al que tenían hasta ahora a su disposición los investigadores de la lengua gallega. "Tiene una especial utilidad para los linguistas que, por ejemplo, pueden comprobar fácilmente cuáles son las preposiciones que suelen seguir a un verbo, pero también puede tener utilidad para otros investigadores como historiadores y sociólogos", indico Rojo.

El proyecto no se detiene con la nueva versión presentada ayer ya que los investigadores del Centro Ramón Piñeiro siguen trabajando para perfeccionar los sistema de búsqueda del CORGA y tratar de incorporar nuevas formas ortográficas para alcanzar la cifra de 25 millones.

La secretaria general de Política Linguísitica, Marisol López, felicitó al centro por poner en marcha una iniciativa que permitirá perfeccionar el trabajo de los investigadores. "Desde este centro se están poniendo a disposición de la sociedad una serie de valiosos recursos y herramientas que, apoyándose en las nuevas tecnologías, permiten un avance exponencial en el conocimiento linguístico", apuntó López.

Lo que más afecta es lo que sucede más cerca. Para no perderte nada, suscríbete.
Suscríbete

Regístrate gratis para seguir leyendo

Si tienes cuenta en EL PAÍS, puedes utilizarla para identificarte
_

Archivado En

Recomendaciones EL PAÍS
Recomendaciones EL PAÍS
Recomendaciones EL PAÍS
_
_