_
_
_
_

Siete "vaixells" por cada "barco" y otros fantasmas

Aunque el Corpus Textual nació con vocación de exhaustividad ("una cantidad de textos suficiente para ser representativa y a la vez analizable en un periodo de tiempo razonable", en palabras de Joaquim Rafel), es evidente que la totalidad es simplemente utópica. El mero hecho de limitar el material de estudio ya implica aceptar esa premisa: está El quadern gris, pero no El llibre dels feyts; está la traducción que hizo Manent de El llibre de la selva, pero no la de Salvador Oliva de Alícia al país de les meravelles. En otras palabras: no se puede asegurar que se hayan introducido todos los vocablos escritos alguna vez en catalán. Los pronunciados, los hablados, de donde Coromines sacó precisamente el mayor caudal para su diccionario etimológico, son capítulo aparte. Según el director, "es muy complicado analizar la lengua oral, y técnicamente no hay sistemas tan desarrollados". A pesar de eso, gracias al tratamiento informatizado de los textos, Rafel y su equipo han podido realizar análisis paralelos simultáneamente al tronco principal de la obra. Uno de estos efectos secundarios se ha concretado en los llamados Diccionaris de freqüències, dos volúmenes en papel (uno para la lengua no literaria, aparecido a finales del 96, y uno para la literaria, a punto de impresión) casi más próximos a la matemática que a la lexicografía. Estos diccionarios calculan la frecuencia de aparición de las palabras en la lengua escrita, es decir, cuántas veces salen en los textos. Y de ahí se deducen datos muy interesantes. Por ejemplo, que en la mayoría de los diccionarios catalanes del mercado (incluido el normativo del IEC) hay miles de términos fantasma, que nadie ha utilizado en los últimos 150 años. Elegidos al azar: espicassar, cercoler, moscalló, solcatera. Que, en ese mismo periodo, los autores (o los correctores de textos) han echado mano de 1.584 vaixells por sólo 219 barcos. Y que no todo el mundo ha estado siempre de acuerdo sobre la ortografía de los vocablos: el verbo esmorzar ha sido escrito de siete formas distintas, aunque el récord lo tiene el adverbio llavors: ni más ni menos que... ¡41!

Lo que más afecta es lo que sucede más cerca. Para no perderte nada, suscríbete.
SIGUE LEYENDO

Archivado En

Recomendaciones EL PAÍS
Recomendaciones EL PAÍS
Recomendaciones EL PAÍS
_
_