O Mrežniku

Ustanova nositelj: Institut za hrvatski jezik i jezikoslovlje

Voditeljica projekta: dr. sc. Lana Hudeček

Trajanje projekta: 1. ožujka 2017. – 28. veljače 2021.

Broj projekta: IP-2016-06-2141

U vrijeme u kojemu se pojam rječnika gotovo izjednačuje s pojmom e-rječnika (u pravilu mrežnoga), a leksikografije s pojmom e-leksikografije, Hrvatska još pripada sve manjemu broju zemalja koje nemaju ni slobodno dostupan mrežni rječnik nacionalnoga jezika utemeljen na spoznajama suvremene e-leksikografije ni sustavno provedena znanstvena istraživanja u tome području. Temeljni je cilj ovoga projekta promijeniti to stanje u oba spomenuta aspekta.

U okviru projekta Hrvatski mrežni rječnik – Mrežnik izrađuje se slobodno dostupan, jednojezični, hipertekstni, jednostavno pretraživ mrežni rječnik hrvatskoga standardnog jezika od 10 000 natuknica. Natuknice te pojedine riječi i izrazi u rječničkim člancima povezuju se međusobno, a također i s natuknicama u bazama podataka koje nastaju u okviru ovoga projekta i izrađuju se usporedno s izradom rječnika (baza jezičnih savjeta, baza veznika s opisom vezničkih skupina i njihove modifikacije, baza objašnjenja podrijetla frazema, baza etnika i ktetika) te bazama koje suradnici na projektu već stvaraju u okviru svojih institutskih zadataka ili koje su vlasništvo Instituta za hrvatski jezik i jezikoslovlje. Uz osnovne, rječnik uključuje i školske definicije (3000) i definicije za strance (1000). Rječnik je utemeljen na korpusu Instituta za hrvatski jezik i jezikoslovlje Hrvatska mrežna riznica (http://riznica.ihjj.hr/index.hr.html) i na Hrvatskome mrežnom korpusu hrWaC (http://nlp.ffzg.hr/resources/corpora/hrwac/). Uz te se izvore pri uspostavi definicija, donošenju primjera i značenja uzimaju u obzir i svi drugi dostupni tiskani i mrežni izvori.

Rječnik se piše u programu TLex, prilagođenu za potrebe projekta, a za crpenje podataka iz korpusa upotrebljava se mrežni alat SketchEngine, koji omogućuje prikaz konteksta leksema putem tzv. skica riječi (WordSketches), najčvršćih kolokacija raspoređenih u sintaktičke kategorije te pronalazak dobrih primjera uporabe riječi ili kolokacija. Nakon završetka leksikografske obradbe podatci će biti izvezeni iz TLexa za mrežnu aplikaciju te u repozitorij europske znanstvene infrastrukture CLARIN (repozitorij clarin.si i javni sustav za upravljanje podatcima github.com). Time će Mrežnik biti učinjen dostupnim i za uporabu putem mrežne aplikacije i za strojnu primjenu preuzimanjem podataka iz repozitorija CLARIN.

U okviru projekta predviđeno je:

1. izrada temeljnoga rječnika od 10 000 natuknica (s naglašenim natuknicama i naglašenim oblicima u gramatičkome bloku sustavno uspostavljenim za svaku vrstu riječi, razvedenim definicijama (osnovnim, školskim i za strance), primjerima, podatcima o antonimima i sinonimima, svezama i frazemima) te bogatim kolokacijskim opisom.

2. izrada i povezivanje s temeljnim rječnikom baza koje se izrađuju usporedno s njegovom obradom: bazom jezičnih savjeta (300 jezičnih savjeta), bazom veznika s opisom vezničkih skupina i modifikacije (za sve veznike u rječniku), bazom objašnjenja podrijetla frazema (50 frazema) te bazom etnika i ktetika (300 etnika i ktetika)

3. povezivanje temeljnoga rječnika s drugim mrežnim izvorima koji se trenutačno izrađuju u ustanovi provedbe projekta, Institutu za hrvatski jezik i jezikoslovlje – s bazom glagolskih valencija e-Glavom, Kolokacijskom bazom hrvatskoga jezika, bazom hrvatskoga strukovnog nazivlja Strunom, mrežnim stranicama Jezični savjetnik i Bolje je hrvatski

4. izrada odostražnoga rječnika na temelju abecedarija Mrežnika

5. intenzivan rad na znanstvenome proučavanju mogućnosti i primjene e-leksikografije, usavršavanje suradnika na projektu i diseminacija stečenoga znanja (među ostalim predviđeno je održavanje skupa o e-leksikografiji u 3. godini projekta, objava e-zbornika radova sa skupa, izrada e-monografije o Hrvatskome mrežnom rječniku) te davanje znatnoga doprinosa ovomu području koje u hrvatskoj znanosti nema mjesto kakvo zaslužuje.

Važno je naglasiti da je Hrvatski mrežni rječnik ­– Mrežnik zamišljen kao dinamični rječnik koji i nakon završetka projektnoga razdoblja otvara mogućnost daljnje dorade.