Projekti koje financira HRZZ

Hrvatski mrežni rječnik (MREŽNIK)

Voditelj: Lana Hudeček

O projektu

Hrvatski mrežni rječnik (MREŽNIK)

IP-2016-06-2141




projekt financira Hrvatska zaklada za znanost


Voditeljica projekta: dr. sc. Lana Hudeček

Suradnici na projektu: dr. sc. Milica Mihaljević (urednica), dr. sc. Kristian Lewis (tajnik), dr. sc. Matea Birtić, dr. sc. Goranka Blagus Bartolec, Joža Horvat, dr. sc. Željko Jozić, dr. sc. Barbara Kovačević, dr. sc. Ivana Matas Ivanković, dr. sc. Bruno Nahod, dr. sc. Dinka Pasini, dr. sc. Ermina Ramadanović, dr. sc. Domagoj Vidović

Vanjski suradnik: dr. sc. Nikola Ljubešić

Trajanje projekta: 1. ožujka 2017. – 28. veljače 2021.

U vrijeme u kojemu se pojam rječnika gotovo izjednačuje s pojmom e-rječnika (u pravilu mrežnoga), a leksikografije s pojmom e-leksikografije, Hrvatska još uvijek pripada sve manjemu broju zemalja koje nemaju ni slobodno dostupan mrežni rječnik nacionalnoga jezika utemeljen na spoznajama suvremene e-leksikografije ni sustavno provedena znanstvena istraživanja u tome području. Temeljni je cilj ovoga projekta promijeniti to stanje u oba spomenuta aspekta.

U okviru projekta Hrvatski mrežni rječnik (MREŽNIK) izradit će se slobodno dostupan, jednojezični, hipertekstni, jednostavno pretraživ mrežni rječnik hrvatskoga standardnoga jezika od 10 000 natuknica koji će omogućivati interakciju s korisnicima. Natuknice i pojedine riječi i izrazi u rječničkim člancima povezivat će se međusobno, a također i s natuknicama u bazama podataka koje će nastati u okviru ovoga projekta i izrađivati se usporedno s izradom rječnika (baza jezičnih savjeta, baza veznika s opisom vezničkih skupina i njihove modifikacije, baza objašnjenja podrijetla frazema, baza etnika i ktetika) te bazama koje suradnici na projektu već stvaraju u okviru svojih institutskih zadataka ili koje su vlasništvo Instituta za hrvatski jezik i jezikoslovlje (navedene u daljnjemu tekstu sažetka). Uz osnovne, rječnik će uključivati i školske definicije (3000) i definicije za strance (1000). Rječnik će biti utemeljen na kopusu (korpus Instituta za hrvatski jezik i jezikoslovlje Hrvatska mrežna riznica http://riznica.ihjj.hr/index.hr.html i Hrvatski mrežni korpus hrWac http://nlp.ffzg.hr/resources/corpora/hrwac/). Uz te će se izvore uzimati u obzir pri uspostavi definicija, donošenju primjera i značenja i svi drugi dostupni tiskani i mrežni izvori.

Rječnik će se pisati u programu TLex, prilagođenu za potrebe projekta, a za crpljenje podataka iz korpusa upotrijebit će se mrežni alat SketchEngine, koji omogućuje prikaz konteksta leksema putem tzv. skica riječi (WordSketches), najjačih kolokacija raspoređenih u sintaktičke kategorije te pronalazak dobrih primjera leksema ili kolokacija. Postupak odabira podataka iz korpusa vrši se putem sučelja za tzv. leksikografsku obradbu putem okvira za potvrdu (TickBox Lexicography). Tako odabrani podatci uključuju se automatski u program Tlex, u kojemu leksikografi nastavljaju opis leksika na svim razinama. Za opis morfološke razine koristit će se između ostaloga i flektivnim morfološkim leksikonom hrLex (https://www.clarin.si/repository/xmlui/handle/1135...), čiji će sadržaj suradnici na projektu prilagoditi i povezati na MREŽNIK. Nakon završetka leksikografske obradbe podatci će biti izvezeni iz TLexa za mrežnu aplikaciju te u repozitorij europske znanstvene infrastrukture CLARIN (repozitorij clarin.si i javni sustav za upravljanje podatcima github.com). Time će MREŽNIK biti učinjen dostupnim i za upotrebu putem mrežne aplikacije i za strojnu primjenu preuzimanjem podataka iz repozitorija CLARIN.

U okviru projekta predviđena je:

1. izrada temeljnoga rječnika od 10 000 natuknica (s naglašenim natuknicama i naglašenim oblicima u gramatičkome bloku sustavno uspostavljenim za svaku vrstu riječi, razvedenim definicijama (osnovnim, školskim i za strance), primjerima, podatcima o antonimima i sinonimina, svezama i frazemima)

2. izrada i povezivanje s temeljnim rječnikom baza koje će se izrađivati usporedno s njegovom obradbom: bazom jezičnih savjeta (300 jezičnih savjeta), bazom veznika s opisom vezničkih skupina i modifikacije (za sve veznike u rječniku), bazom objašnjena podrijetla frazema (50) te bazom etnika i ktetika (300 etnika i ktetika)

3. povezivanje temeljnoga rječnika s drugim mrežnim izvorima koji se trenutačno izrađuju u ustanovi provedbe projekta, Institutu za hrvatski jezik i jezikoslovlje (bazom glagolskih valencija (koja bi obuhvatila sve uključene glagole, pa bi po potrebi bila dopunjena), bazom kolokacija (u koju je uključena i baza frazema), bazom hrvatskoga strukovnog nazivlja Strunom, Repozitorijem hrvatskih metafora, mrežnim stranicama Bolje je hrvatski (bolje.hr))

4. izrada odostražnoga rječnika

5. intenzivan rad na znanstvenome proučavanju mogućnosti i primjene e-leksikografije, usavršavanje suradnika na projektu i diseminacija stečenoga znanja (među ostalim predviđeno je održavanje skupa o e-leksikografiji u 3. godini projekta, objava e-zbornika radova sa skupa, izrada e-monografije o Hrvatskome mrežnom rječniku) te davanje znatnoga doprinosa ovome području koje u hrvatskoj znanosti nema mjesto kakvo zaslužuje.

Važno je naglasiti da iako bi rječnik unutar projektnoga razdoblja bio dovršen u opsegu određenu ovom projektnom prijavom, on je zamišljen kao dinamični rječnik koji i nakon završetka projektnoga razdoblja otvara mogućnost daljnje dorade.

Suradnici na projektu

Goranka Blagus Bartolec rođena je 30. prosinca 1970. u Kneževu u Baranji. Na Filozofskom fakultetu u Zagrebu diplomirala je 29. rujna 1995. opću lingvistiku i komparativnu književnost s radom Usporedbe putopisnoga ...

Pročitaj više

1. Osobni podatci Ime i prezime: Kristian Lewis Godina i mjesto rođenja: 1975., Zagreb Obitelj: supruga Ana, sin Nikola i kći Katarina 2. Radno iskustvo 2001. – danas – Institut za hrvatski jezik i jezikoslovlje, z...

Pročitaj više

Dr. sc. Ivana Matas Ivanković rođena je 22. veljače 1975. godine u Zagrebu, gdje je završila osnovnu i srednju školu (Pedagoški obrazovni centar). Diplomirala je 1999. na Filozofskom fakultetu u Zagrebu grupe Hrvat...

Pročitaj više

Rođen je 29. siječnja 1978. u Zagrebe, gdje je završio opću gimnaziju. Diplomirao je arheologiju i opću informatologiju godine 2004. na Filozofskome fakultetu u Zagrebu. Od 2004. do 2007. radio je u obiteljskoj firm...

Pročitaj više

Pravopis

pravopis.hr

Struna

struna.ihjj.hr

Savjetnik

jezicni-savjetnik.hr

Riznica

riznica.ihjj.hr

Hrvatski u školi

hrvatski.hr

Nazivlje

nazivlje.hr

Bolje.hr

bolje.hr

Matura

matura.ihjj.hr