Lau milioitik gora hitz biltzen ditu euskarazko XX. mendeko corpusak
Ezinezkoak lirateke corpusak informatikarik ez balego. Ziurtasun osoz adierazi zuen joan den astean UZEIk antolatutako Hizkuntza eta Corpusak. Oraina eta geroa lemapean Donostian burutu diren jardunaldietan parte hartutako Guillermo Rojok.
Corpusetaz, hau da, modu errazean esateko, hizkuntza baten hitzen bilduma batetaz, hitzegiterakoan adituek azpimarratzen duten lehenengo gauzetako bat hauek tresna gisa duten balioa da. Izan ere, corpusak ondoren egingo diren ikerketa eta aplikazio ezberdinetan erabiltzeko oinarria baitira. Hori dela eta, corpus bat osatzeko orduan emango zaion erabilera oso garrantzitsua da sortze prozesua aurrera eramateko. Ez da lan bera egin beharko, esaterako, hizkuntza baten corpus orokorra osatzeko edo herri bateko gazte literaturaren corpusa osatzeko.
Euskara, katalana, galiziarra eta gazteleraren corpusak, gaur egun, oso egoera ezberdinean aurkitzen direla esan daiteke, tamainari dagokionean, batik bat. Gaztelerakoak 130 milioitik gora hitz biltzen baditu ere, katalanak 50 milioi inguru, galiziarrak 17 bat eta euskarazkoak, aldiz, lau miliotik gora hitz biltzen ditu. Hala ere, Konpostelako Santiagoko Unibertsitateko irakasle eta Real Academia Españolako kidea den Rojoren esanetan, 'euskarazkoa da ezagutzen ditudan corpusen artean erabilera aukera gehien ematen dituenetariko bat, egina dagoen moduagatik oso praktikoa gertatzen baita ondorengo aplikazioetarako'. Hauetariko bat izango litzateke , adibidez, euskaraz ordenagailuz idazterakoan ortografia eta gramatika zuzentzen dituen Xuxen programarena.
Tu suscripción se está usando en otro dispositivo
¿Quieres añadir otro usuario a tu suscripción?
Si continúas leyendo en este dispositivo, no se podrá leer en el otro.
FlechaTu suscripción se está usando en otro dispositivo y solo puedes acceder a EL PAÍS desde un dispositivo a la vez.
Si quieres compartir tu cuenta, cambia tu suscripción a la modalidad Premium, así podrás añadir otro usuario. Cada uno accederá con su propia cuenta de email, lo que os permitirá personalizar vuestra experiencia en EL PAÍS.
En el caso de no saber quién está usando tu cuenta, te recomendamos cambiar tu contraseña aquí.
Si decides continuar compartiendo tu cuenta, este mensaje se mostrará en tu dispositivo y en el de la otra persona que está usando tu cuenta de forma indefinida, afectando a tu experiencia de lectura. Puedes consultar aquí los términos y condiciones de la suscripción digital.