نبذة مختصرة : Proiektu honen helburua Twitter-eko txioetan euskara-gaztelaniazko code-switching de- lako fenomeno linguistikoa aztertzea da. Horretarako, errealitatearen corpus adierazga- rri bat sortu da, euskarazko, gaztelaniazko eta txio elebidunak bilduz, hainbat pertsonaia publiko eta bestelako erabiltzaileengandik. CRF sekuentzia etiketatzailea erabili da sis- temari ezagutza emateko, algoritmo honek datu sekuentziak tratatzeko duen izaeragatik. CRF algoritmoaren doiketa izan da proiektuaren atal nagusia, asmatze-tasen hobekun- tza lortzeko asmoz. Emaitza gisa, denbora errealean, streaming bidez, lortutako txioen code-switching-a analizatuko duen aplikazioa sortu da, non bilaketak erabiltzaile konkre- tu baten edo hitz konkretu baten arabera egiteko aukera dagoen. Gainera, EUS-ES code- switching fenomenoaren detekzio automatikoan lehen urratsak ematea bilatu da, etorki- zuneko proiektuentzat abiapuntua finkatuko duen proiektua burutuz.
No Comments.