Glavni cilj
Prema iscrpnoj jezičnoporedbenoj studiji u okviru META-NET White Paper Series, i hrvatski i slovenski jezik jezičnotehnološki su slabije razvijeni jezici kojima manjka naprednih jezičnih resursa i alata za obradu prirodnoga jezika. Označivanje semantičkih uloga sljedeći je korak jezikoslovne analize koji se može uspješno nadograditi na ostvarene slojeve jezikoslovnoga označivanja u postojećim hrvatskim i slovenskim korpusima za učenje. Za bliske jezike koji dijele mnoge jezične značajke, poželjno je primjenjivati slična jezikoslovna načela i sustave označivanja u jednakim zadaćama obrade prirodnoga jezika. Stoga je cilj projekta izgraditi sustav oznaka semantičkih uloga koje će biti sukladne postojećim sintaktičkoovisnosnim oznakama korištenima u korpusima koji su se rabili za algoritme strojnoga učenja za oba jezika. To će rezultirati uzorcima slovenskoga i hrvatskoga korpusa za učenje koji će biti označeni kompatibilnim oznakama u obama jezicima. Takvi će korpusi poslužiti kao osnova za prve eksperimente automatskoga označivanja semantičkih uloga s pomoću metoda nadziranoga strojnoga učenja.
Temeljne zadaće
U okviru projekta predviđaju se tri temeljne zadaće:
Rezultati
U okviru projekta izradit će se ovi dokumenti, skupovi podataka i alati:
Svi će dokumenti, skupovi podataka i alati biti dostupni pod otvorenim licencijama, što je u skladu sa zahtjevima postojećih korpusa za učenje.
CV in EnglishKristina Štrkalj Despot diplomirala je 2002. i doktorirala 2007. godine na Filozofskome fakultetu u Zagrebu unutar 10 % najboljih studenata. Od 2003. godine radi u Institutu za hrvatski jezik. Zvanje znanst...
Pročitaj više
Pravopispravopis.hr |
Gramatikagramatika.hr |
Savjetnikjezicni-savjetnik.hr |
Bolje.hrbolje.hr |
Hrvatski u školihrvatski.hr |
Riznicariznica.ihjj.hr |
Nazivljenazivlje.hr |
Maturamatura.ihjj.hr |
Frazemifrazemi.ihjj.hr |
Valencijevalencije.ihjj.hr |
Kolokacijeihjj.hr/kolokacije/ |
Metaforeihjj.hr/metafore/ |