_
_
_
_
_
Gaiak

Zientzia alorreko lehen corpusa osatu dute EHUk eta Elhuyarrek

Zientzia eta teknologiaren alorreko euskara ikertzeko tresna ahal-tsua abian jarri dute Elhuyar Fundazioak eta EHUko Ixa Taldeak, jakintzaren esparru horretako lehen corpus berezi edo espezializatua hain zuzen ere. Tresna berriak 1990tik 2002ra bitartean argitaratutako obretako testuak ditu oinarri, eta Interneten kontsultagai dago www.ztcorpusa.net helbidearen bidez iragan asteko ostegunaz geroztik, egun horretan aurkeztu baitzuten ofizialki fundazioak Usurbilen duen egoitzan.

Corpusa zortzi milioi hitzez osatuta dago, horietatik 1,6 eskuz berrikusi, desanbiguatu eta zuzenduak. Datu basea etiketatuta dago, bai testuaren egiturari eta formatuari dagokionez, bai linguistikoki, eta testuko hitz bakoitzaren lema eta kategoria etiketatu dituzte proiektua garatu duten teknikariek.

Erabiltzaileek era askotako bilaketa bakunak eta konplexuak egiteko aukera dute, hala nola lemaren, testu-formaren, kategoriaren, eremuaren eta generoaren arabera.

Emaitzak bi eratakoak dira, batetik, kontsultagaiaren testuinguruak, bai laburrak eta bai hedatuak. Bestetik, egindako gaiari buruzko informazio kuantitatiboa eskaintzan du interfazeak, taula eta grafikoen bidez, adibidez, lemen eta formen agerraldien maiztasuna, horien aurretik edo ondoren agertzen diren lemen eta formen maiztasunak eta eremu edo generoaren araberako banaketa.

Internautek bildutako informazio guztia kontsulta dezakete aipatutako webgunearen bidez. Horrez gain, ikerkuntzarako hi-tzarmen bidezko dohaintza aurreikusi dute Ehuyarrek eta EHUk. Hortaz, ikerkuntzan ari diren erakunde edo ikertzaile-taldeek doan eskura dezakete. Horrez gain, ustiapen komertziala (hiztegigintza eta hizkuntza-teknologietako aplikazioak, beste aukera batzuen artean) lizentzia bidez egin daiteke..

Fidagarritasuna

Lo que más afecta es lo que sucede más cerca. Para no perderte nada, suscríbete.
Suscríbete

Horri lotuta, bildutako informazioaren fidagarritasuna nabarmendu dute proiektuaren arduradunek. "Corpusean biltzen diren datuak errealak dira. Norbaitek erabaki bat hartu behar badu, adibidez nola erabili den orain arte hitz jakin bat zientziaren eta teknologiaren esparruan, orain arte ez zuen lanabesa izango du aurrerantzean", azaldu du Elhuyarreko teknikari Antton Gurrutxagak.

Mota honetako corpus berezien bidez, erabilera-eremu espezifiko baten edo aldaera jakin baten ezaugarriak hobeto azter-tzeko aukera dago. Corpuseko datuak aztertuz, hizkuntzaren aztertzaileek ondorioak atera ditzakete eta proposamenak egin ere bai, dagokion alorreko adituek erabili beharreko hizkuntza-ereduari buruzko argibideak izan ditzaten, baita erakunde arau-emaileek espezialitate-alorreko ebazpenak eman ahal izan ditzaten ere, egitasmoaren bultzatzaileen arabera.

Regístrate gratis para seguir leyendo

Si tienes cuenta en EL PAÍS, puedes utilizarla para identificarte
_

Archivado En

Recomendaciones EL PAÍS
Recomendaciones EL PAÍS
Recomendaciones EL PAÍS
_
_