GAIAK

Lau milioitik gora hitz biltzen ditu euskarazko XX. mendeko corpusak

Ezinezkoak lirateke corpusak informatikarik ez balego. Ziurtasun osoz adierazi zuen joan den astean UZEIk antolatutako Hizkuntza eta Corpusak. Oraina eta geroa lemapean Donostian burutu diren jardunaldietan parte hartutako Guillermo Rojok.

Corpusetaz, hau da, modu errazean esateko, hizkuntza baten hitzen bilduma batetaz, hitzegiterakoan adituek azpimarratzen duten lehenengo gauzetako bat hauek tresna gisa duten balioa da. Izan ere, corpusak ondoren egingo diren ikerketa eta aplikazio ezberdinetan erabiltzeko oinarria baitira. Hori dela eta, corpus bat osatzeko orduan emango zaion...

Suscríbete para seguir leyendo

Lee sin límites

Ezinezkoak lirateke corpusak informatikarik ez balego. Ziurtasun osoz adierazi zuen joan den astean UZEIk antolatutako Hizkuntza eta Corpusak. Oraina eta geroa lemapean Donostian burutu diren jardunaldietan parte hartutako Guillermo Rojok.

Corpusetaz, hau da, modu errazean esateko, hizkuntza baten hitzen bilduma batetaz, hitzegiterakoan adituek azpimarratzen duten lehenengo gauzetako bat hauek tresna gisa duten balioa da. Izan ere, corpusak ondoren egingo diren ikerketa eta aplikazio ezberdinetan erabiltzeko oinarria baitira. Hori dela eta, corpus bat osatzeko orduan emango zaion erabilera oso garrantzitsua da sortze prozesua aurrera eramateko. Ez da lan bera egin beharko, esaterako, hizkuntza baten corpus orokorra osatzeko edo herri bateko gazte literaturaren corpusa osatzeko.

Euskara, katalana, galiziarra eta gazteleraren corpusak, gaur egun, oso egoera ezberdinean aurkitzen direla esan daiteke, tamainari dagokionean, batik bat. Gaztelerakoak 130 milioitik gora hitz biltzen baditu ere, katalanak 50 milioi inguru, galiziarrak 17 bat eta euskarazkoak, aldiz, lau miliotik gora hitz biltzen ditu. Hala ere, Konpostelako Santiagoko Unibertsitateko irakasle eta Real Academia Españolako kidea den Rojoren esanetan, 'euskarazkoa da ezagutzen ditudan corpusen artean erabilera aukera gehien ematen dituenetariko bat, egina dagoen moduagatik oso praktikoa gertatzen baita ondorengo aplikazioetarako'. Hauetariko bat izango litzateke , adibidez, euskaraz ordenagailuz idazterakoan ortografia eta gramatika zuzentzen dituen Xuxen programarena.

Lo que más afecta es lo que sucede más cerca. Para no perderte nada, suscríbete.
SIGUE LEYENDO