Repozitorij SARGADA

Kao što je od samoga početka projekta navedeno u opisu metodologije i ciljeva istraživanja, primijenjeni dio projekta Sintaktička i semantička analiza dopuna i dodataka u hrvatskom jeziku – SARGADA pretpostavio je stvaranje računalne baze za opis dvojbenih slučajeva. Tijekom pripremne faze za izradu strukture relacijske baze podataka za repozitorij konzultirani su raznovrsni resursi u kojima se glagoli analiziraju sintaktički i semantički (primjerice, ovisnosne banke stabala, valencijski rječnici i resursi kao što su FrameNet ili Verbnet), no sam repozitorij nema izravni utjecaj (iako su ta prvotna saznanja tijekom istraživanja posredno utkana u njegovu strukturu). Preciznije rečeno, naša istraživanja navedenih izvora nisu nam otkrila postoji li potpuno usporediv pokušaj, stoga repozitorij koji predstavljamo predstavlja potencijalno jedinstven pothvat pri stvaranju baze podataka u kojoj se bilježe i prikazuju rezultati ispitivanja je li neka rubna skupina dopuna ili dodatak za određeni jezik. Pred vama je pokušaj prikaza za hrvatski jezik, a postavlja se i dodatno intrigantno lingvističko pitanje bi li se sličan sustav mogao primijeniti i na druge (tipološki bliske) jezike. Raspravu o tom pitanju možemo otvoriti tek nakon ove objave pretražive inačice repozitorija SARGADA na internetu.

Javno dostupan dio repozitorija SARGADA kojemu možete pristupiti s početne stranice i pregledavati ga jednostavno je organiziran abecedarij, odnosno popis hiperveza na obrađene primjere glagola u njemu, uz dodanu podjelu na tzv. makroskupine kojima ti glagoli u bazi podataka pripadaju. Makroskupine su također prikazane kao hiperveze i njihovim otvaranjem dobit ćete popis glagola koji su obrađeni unutar tražene makroskupine. Otvaranjem poveznice s pojedinim glagolom dobiva se grafički prilagođen prikaz obradbe primjera rečenice na hrvatskom jeziku koja uz taj glagol (predikat) sadržava rečenične dijelove koje mogu imati sintaktički dvojbene funkcije u smislu određivanja dopuna i dodataka. Ovdje dostupan grafički prikaz obrade takva primjera možemo podijeliti na četiri istaknute sastavnice:

a) na vrhu se ponavlja glagolska lema s pridruženom makroskupinom

b) potom slijedi rečenični primjer rastavljen na dijelove prema sintaktičkome modelu koji je istraživački tim dogovorio tijekom projekta

c) treći dio prikaza tekstovno pokazuje koje su rezultate za testiranu dvojbenu skupinu u primjeru dali odabrani dijagnostički testovi

d) vizualni prikaz na dnu stranice statistički prikazuje u kojem stupnju rezultati testova pokazuju da je riječ o dopuni (crveni dio polukruga), akoliki da je riječ o dodatku (sivi dio polukruga).

Sve koje detaljnije zanimaju proces i metodologija izrade pozadinskoga sustava za obradu, odnosno kako su birani glagoli, određene makroskupine, sintaktički model za rastavljanje rečenice i sedam dijagnostički testova, upućujemo na članak (na engleskom jeziku) Birtić, Matea; Brač, Ivana; Runjaić, Siniša. 2022. Croatian repository for the argument/adjunct distinction – SARGADA. Proceedings of the Fifth International Conference Computational Linguistics in Bulgaria (CLIB 2022). Ed. Koeva, Svetla. Bulgarian Academy of Sciences. Sofia. 225–234. Također je taj proces predstavljen nekoliko puta na različitim znanstvenim konferencijama, ali posljednja je sažeta inačica s posljednjega predstavljanja projekta održanog u siječnju 2024. dostupna ovdje.