Selecciona Edición
Conéctate
Selecciona Edición
Tamaño letra

52 milions de mots per fer el català d'ara

El ‘Diccionari descriptiu’ inclou mots no acceptats per la normativa

Joaquim Rafel, a la seu de la Secció Filol`gica de l'IEC. Ampliar foto
Joaquim Rafel, a la seu de la Secció Filol`gica de l'IEC.

El monumental Diccionari del català contemporani encara la recta final amb la seva última fase, el Diccionari descriptiu de la llengua catalana. És un dels objectius fundacionals de l’Institut d’Estudis Catalans (IEC), un dels seus projectes més innovadors i ferms i que té al darrere anys de feina.

Joaquim Rafel, catedràtic de Filologia Catalana, membre de la Secció Filològica de l’IEC i responsable d’aquest projecte, considera que és la culminació d’un recorregut que va començar el 1911, quan es va crear la Secció Filològica de l’entitat.

Divideix Rafel l’atzarosa trajectòria de la secció i de l’IEC en tres grans moments: des dels inicis fins al 1939; després, un llarg període de clandestinitat (a la dictadura de Franco no li agradaven aquestes activitats), tot i que el 1954 va aparèixer la segona edició, revisada, del diccionari Fabra; i una nova etapa iniciada el 1976, després de la mort del dictador, que els primers anys va ser força testimonial.

Gràfic de la estructura del Diccionari descriptiu de la llengua catalana. ampliar foto
Gràfic de la estructura del Diccionari descriptiu de la llengua catalana.

“No teníem ni ordinadors, ni local propi, ni pressupost”, recorda Rafel. Durant un temps, la Secció Filològica, que és “com una acadèmia de la llengua”, va estudiar com reprenia la seva tasca lexicogràfica. I es va decidir que ho faria d’acord amb els canvis que havia experimentat la societat durant un parèntesi tan llarg.

“Va arribar una subvenció, una quantitat important, del Govern de Madrid, i ens vam posar en marxa”. I ho van fer tenint en compte els avenços científics, metodològics i tecnològics que s’estaven produint. En aquesta línia, en els primers vuitanta es va endegar el Diccionari del català contemporani (DCC), que defineix les unitats lèxiques des del punt de vista del contingut i de la utilització real de la llengua. “El DCC aporta un coneixement profund de la realitat de la llengua al marge de consideracions normatives, i aquest coneixement és necessari per establir la normativa de la manera més coherent”, explica Rafel.

Per tirar-lo endavant es van endegar, en aquesta primera fase, dues eines imprescindibles: el Corpus Textual Informatitzat de la Llengua Catalana (CTILC), una infraestructura lingüística bàsica de recerca i estudi, i la Base de Dades Lexicogràfica.

El Corpus Textual, que avui supera els 52 milions de mots, es va fer entre 1985 i 1997. És un corpus de referència de la llengua catalana escrita en els darrers 150 anys aproximadament. Les paraules introduïdes provenen de la llengua literària (narrativa, poesia, assaig i teatre) i de la no literària (premsa, filosofia, ciències socials, ciències pures i naturals, belles arts...).

La Base de Dades Lexicogràfica conté, informatitzats, els 13 diccionaris catalans que han estat considerats més significatius dels segles XIX i XX. Hi són el Diccionari de la llengua catalana: ab la correspondencia castellana y llatina (1839-1840); el Diccionari general de la llengua catalana (1932), de Pompeu Fabra; el Diccionari mallorquí-castellà (1840); el Diccionario catalán-castellano-latino (1803-1805); el Diccionari català-valencià-balear (1926-1962), el Pal·las: diccionari català-castellà-francés; amb vocabularis castellà-català i francés-català (1927) i el Diccionari de la llengua catalana (1995) de l’IEC, entre d’altres.

Un exemple explica de manera molt clara la utilitat del Corpus Textual Informatitzat de la Llengua Catalana: “Treure un petit tros (a una cosa intacta), començar-la a gastar” i “Pelar o irritar la pell (d’una part del cos)” són les dues definicions del verb encetar que recull el diccionari DIEC2. Però l’ús més habitual d’aquest verb no és cap dels que estableix el text de l’IEC. Encetar s’utilitza normalment com a sinònim “d’iniciar una acció, una tasca o un desplaçament d’una certa durada”. S’ha arribat a aquesta conclusió després d’analitzar aquest mot a partir de la consulta del gegantí Corpus Textual.

Gràfic del projecte del Diccionari del català contemporani (DCC). ampliar foto
Gràfic del projecte del Diccionari del català contemporani (DCC).

Realitzades aquestes dues bases fonamentals, estava tot a punt per iniciar la segona fase del Diccionari del català contemporani: el Diccionari descriptiu de la llengua catalana (DDLC).

El Diccionari descriptiu és com una base de dades multifuncional que utilitza com a font exclusiva el Corpus Textual. “Tracta la llengua”, afirma Rafel, “sense consideracions de caràcter normatiu. I en la descripció de la realitat de la llengua apareixen elements que no estan admesos normativament. La realitat de la llengua la trobem al Corpus Textual”.

Hi va haver un gran debat sobre aquesta qüestió al si de la Secció Filològica, que finalment va decidir que s’identificaria amb una marca visible tots els elements que no tinguessin la sanció normativa explícita en el moment de divulgar-los.

El procés de redacció del Diccionari descriptiu de la llengua catalana és diferent del que s’utilitza en l’elaboració de la major part de diccionaris. No segueix l’ordre habitual en la redacció dels articles, sinó que, juntament a la redacció del mot que correspon per ordre alfabètic, s’anoten també els articles relatius als mots que hi estan vinculats, per la forma o pel significat. Per exemple, amb el terme adulació s’han redactat 46 mots més, com ara adulador, afalagador, lloa, lloança o loació.

El Diccionari descriptiu acabarà tenint, en principi, 100.000 entrades, de les quals ja s’han redactat més de 85.000. Estava previst acabar-lo d’aquí dos anys, però la Secció Filològica de l’IEC també ha patit retallades. S’ha vist obligada a prescindir de nou filòlegs i tenen por que la cosa no acabi aquí, així que la data de finalització no és segura.

El 'Diccionari descriptiu' inclou mots no acceptats per la normativa

El DDLC, que es regeix pels criteris de la lexicografia contemporània més avançada, no és estrictament pedagògic. Està concebut com una investigació sobre bases noves, i aspira al màxim rigor científic en la seva realització. Segons la Secció Filològica, els destinataris ideals són les persones amb un cert domini dels conceptes lingüístics, però aspira a estar a l’abast de qualsevol usuari interessat per la llengua.

Es preveu publicar-lo de manera convencional i podria tenir, segons Rafel, al voltant de set volums; també podria disposar d’una edició electrònica independent de la base de dades, en un disc compacte, per exemple; o bé una divulgació electrònica a través d’Internet. Els més de 85.000 mots del DDLC es poden consultar a la pàgina web de l’IEC des de 2005 i està en actualització permanent.

L’IEC es dota, amb una obra d’aquesta envergadura, d’un “instrument molt valuós a l’hora d’exercir la seva activitat com a institució acadèmica encarregada de l’establiment i de l’actualització de la normativa lingüística”, segons Rafel. Com també d’una gramàtica normativa, entre altres treballs. D’alguna manera, com ara fa 100 anys.