Kolokacijska baza hrvatskoga jezika

Suradnici

  • znanstvenice Instituta za hrvatski jezik i jezikoslovlje dr. sc. Goranka Blagus Bartolec, dr. sc. Barbara Kovačević, dr. sc. Ivana Kurtović Budja, dr. sc. Ivana Matas Ivanković i vanjski suradnik Dr. phil. Stefan Rittgasser (Njemačka)
  • savjetnica za nazive iz područja informatike i informacijskih znanosti: dr. sc. Milica Mihaljević
  • računalna i mrežna podrška: Vedran Cindrić

Kolokacijska baza hrvatskoga jezika osmišljena je kao dinamičan (s mogućnošću nadogradnje) rječnik sveza riječi hrvatskoga jezika koje se unose i obrađuju u relacijskoj bazi podataka. Rezultati projekta javno su dostupni i pretraživi na mrežnoj stranici Instituta za hrvatski jezik i jezikoslovlje.

Projekt se temelji na opširnom korpusu koji je u početnoj fazi rada prikupio i računalno obradio Dr. phil. Stefan Rittgasser. Uzorak te baze objavljen je na mrežnoj adresi www.lingua-hr.de.

Kolokacijska baza hrvatskoga jezika dostupna je na mrežnoj adresi http://ihjj.hr/kolokacije/. U sklopu projekta od lipnja 2017. dostupna je i Baza frazema hrvatskoga jezika na mrežnoj adresi http://frazemi.ihjj.hr/.

Cjelokupna građa uvrštena u Kolokacijsku bazu nastala je prikupljanjem podataka iz izvora suvremenoga hrvatskog jezika. Tijekom rada na projektu temeljni korpus iscrpno je proširen i dopunjen novim izvorima u skladu sa zahtjevima koji su se  nametnuli tijekom rada.

Građa obuhvaća:

  • raznovrstan hrvatski dnevni, tjedni i mjesečni tisak
  • bazu Narodnih novina
  • stručnu literaturu: izbor 10 jezikoslovnih časopisa (nekoliko novijih godišta te  računalno čitljive radove s temom o svezama riječi)
  • lijepu književnost prema računalnom korpusu Hrvatska jezična riznica (http://riznica.ihjj.hr/)
  • terminološku bazu STRUNA
  • korpus hrWaC (http://nlp.ffzg.hr/resources/corpora/hrwac/)
  • suvremene rječničke i enciklopedijske mrežne i tiskane izvore hrvatskoga jezika (Školski rječnik hrvatskoga jezika (Institut za hrvatski jezik i jezikoslovlje, 2012.), VRH – Veliki rječnik hrvatskoga standardnog jezika (Školska knjiga, 2015.), HJP – Hrvatski jezični portal, http://hjp.znanje.hr/, Proleksis enciklopedija, http://proleksis.lzmk.hr/)

Koncepcija Kolokacijske baze hrvatskoga jezika

U Kolokacijskoj bazi hrvatskoga jezika donosi se iscrpan popis sveza riječi hrvatskoga jezika s opisom njihovih glavnih gramatičkih i značenjskih obilježja te se bilježe mogućnosti njihove upotrebe. Podatci uneseni u bazu iscrpan su temelj za daljnja različita jezikoslovna istraživanja (gramatička, sintaktička, leksikološka), unapređenje korpusnih alata za prepoznavanje čvrstih leksičkih sveza (višerječnih imena, kolokacijskih sveza, frazema, poslovica, pragmema, višerječnih naziva, gramatičkih sveza (višerječnih prijedložnih, vezničkih ili priložnih izraza) te koligacija (ustaljenih rečeničnih sklopova)), izradu novih leksikografskih (tiskanih i mrežnih) priručnika te za istraživanja na dvojezičnoj ili višejezičnoj razini koja će biti korisna u prevođenju, izradi paralelnih korpusa te u učenju hrvatskoga kao stranoga/inoga jezika.

U Kolokacijskoj bazi oblik sveze ne donosi se samo pod jednom nosivom natuknicom, nego pod svim sastavnicama (samoznačnim i suznačnim) koje tvore pojedinu svezu (npr. kolokacija četkica za zube navodi se pod natuknicama četkica, zub i za. Takva se struktura Baze temelji na postavci da svaka sastavnica svojim značenjskim potencijalom oblikuje cjelokupni značenjski potencijal sveze te nije primijenjen hijerarhijski kriterij donošenja natuknice samo pod određenom natuknicom kao glavnom ili nosivom.

Svaka je sveza u Bazi prema svojim leksičkim i semantičkim obilježjima označena posebnom oznakom te korisnik dobiva podatak o vrsti leksičke sveze i, na temelju unesenih primjera, o kontekstu njezine najčešće primjene. Baza sadržava iscrpan popis frazema (mlatiti praznu slamu), višerječnih naziva (binomni poučak), kolokacijskih sveza (četkica za zube, spavaća soba), slobodnih sveza (sunčan dan, lijep glas), pragmema (dobar dan, dobro došli), poslovica (Željezo se kuje dok je vruće.), prijedložno-padežnih izraza (niz dlaku, bez problema), gramatičkih sveza kao što su različiti veznički, priložni i prijedložni skupovi (s obzirom na to da, preko puta, s pomoću, bilo kako, budući da) te koligacija, tj. ustaljenih sveza na sintaktičkoj razini (može se reći da, kad je u pitanju, nameće se zaključak da, ono što najprije upadne u oči jest činjenica da, kako sada stvari stoje…).

Osim ustaljenih sveza na sintagmatskoj razini, Baza sadržava brojne (učestale i manje učestale) primjere uporabe pojedinih riječi koji se ne mogu odrediti kao određena vrsta čvrste sveze, dakle primjere koji nisu kolokacijska sveza, gramatička sveza, višerječni naziv, frazem, poslovica ili pragmem, ali se temelje na uobičajenoj sintaktičkoj strukturi i ostvaruju se u komunikacijskoj praksi (razgovornoj, službenoj, administrativnoj, publicističkoj, književnoj). Takvi primjeri u bazi najčešće nemaju oznaku za vrstu sveze jer ne posjeduju obilježja koja su svojstvena drugim čvrstim svezama u hrvatskome jeziku, ali svjedoče o različitim mogućnostima sintaktičke i stilske upotrebe te su zanimljivi na razini prevođenja ili u poučavanju hrvatskoga kao stranoga jezika.

Iako se za prototipni oblik kakve sveze najčešće navodi sveza koju tvore pridjev + imenica (kreditna kartica, radni stol, montažna kuća), imenica + prijedložno-padežni izraz (četka za kosu), imenica + imenica (zemlja partner), u Bazi su pobrojeni različiti drugi modeli sveza koje tvore i druge vrste riječi, pa se uz temeljni pridjevno-imenički model donose i druge sveze koje tvore samoznačne ili suznačne sastavnice: glagolske, ponajprije perifrazne, sveze (doći do zaključka, održati sjednicu), prijedložne, vezničke i priložne sveze (u vezi s, osim toga, bilo kako, malo kasnije, kao i).

Neke riječi u hrvatskome jeziku imaju bogat kolokacijski potencijal, dok se nekim riječima, iako se učestalo upotrebljavaju u svakodnevnoj komunikaciji, ne može pripisati to obilježje. Izradom Kolokacijske baze namjera je obuhvatiti različite sveze kojima se potvrđuje povezivost pojedinih riječi s drugima. Cilj je donijeti iscrpan popis sveza riječi hrvatskoga jezika s opisom njihovih glavnih gramatičkih i značenjskih obilježja te pokazati mogućnosti njihove uporabe koje se, u skladu s postojećim teorijskim opisom višerječnih sveza (usp. popis literature), mogu odrediti kao vrsta čvrste ili slobodne sveze:

Frazemi: ustaljene  sveze  riječi  koje  se  upotrebljavaju  u  gotovu  obliku  čije  značenje  proizlazi  iz  cjeline  te  ne  odgovara  zbroju  značenja  pojedinačnih  sastavnica  (mlatiti  praznu  slamu, prodavati  maglu).

Kolokacije (kolokacijske sveze): ustaljene sveze čije  se  sastavnice  povezuju  na  temelju  svojih  pojedinačnih  značenja  tvoreći  čvrsto  značenje  sveze,  a  njihova  uporaba  nadilazi  područje  koje  struke  i  prelaze  u  opći  leksik  govornika  neke  jezične zajednice. Osim prototipnih pridjevno-imeničkih (izdavačka  kuća, svijetlo  pivo, crno  zlato) i imeničko- imeničkih (grad država, putnik namjernik, suze radosnice) imeničko-prijedložnih kolokacija (četkica za zube, krevet na kat) (četkica  za  zube), u bazi se navode glagolske kolokacije s imenskom sastavnicom (podnijeti/dati  ostavkustupiti na snagu) te glagolsko-prijedložne kolokacije koje otvaraju mjesto imeničkoj dopuni (doći do /koga, čega/, izići na /što/, odustati od /koga, čega/, sastati se s /kim, čim/).

Všerječni nazivi (kao i jednorječni nazivi): višerječne sveze koje su ustaljene u području neke struke, djelatnosti ili znanstvene discipline (rimsko pravo, atmosferska korozija, Grimmov zakon, kavezni namotaj).

Višerječna  imena  (kao  i  jednorječna  imena):  označuju  pojedinačne  ljudske, društvene ili zemljopisne entitete (Atlantski oceanSjedinjene  Američke  Države, Bič Božji). 

Poslovice: sažete  tekstne  forme  sadržajno  temeljene  na  životnom  iskustvu  ili  mudrosti  (Što  pijan  misli,  trijezan  kaže.,  U  postolara  najgore  cipele.). 

Višerječni pragmemi  (kao i jednorječni pragmemi): ustaljeni  izrazi  u  komunikacijskoj  praksi  (pozdravi,  zahvale,  čestitke). 

Višerječne leksičke jedinice: višerječne sveze koje imaju obilježja višerječnoga leksema (božja ovčica, vučja noga (biljka), crveni vjetar (kožna bolest), morski pas) jer im se značenje ne može podvesti pod značenje jednorječne natuknice (npr. morski pas ne može se podvesti pod značenje natuknice pas).

Koligacije: ustaljeni višerječni sklopovi na sintaktičkoj razini koji utječu na širi rečenični ustroj kao što su konektori, gramatički frazemi (različite sveze s nepunoznačnim sastavnicama kao što su veznici, prijedložni izrazi i sl.) i rečenične strukture (povrh toga, s pomoću, osim toga, može se reći da, s obzirom na to da, ne samo.. nego i…).

U Bazi se navode i primjeri sveza koje su česte u uporabi, ali pripadaju razgovornomu ili kojemu drugomu stilu s uputom na standardni, tj. neutralni oblik (ići kod liječnika (razg.) upućuje se na ići k liječniku / ići liječniku, po dolasku (razg.) upućuje se na nakon dolaska, prijedlog pored upućuje se na prijedlog pokraj, ali se navodi frazem proći pored /koga, čega/ kao pored turskoga groblja u kojemu se bilježi upotreba prijedloga pored. Neki nestandardni oblici ako su sastavnica kakve sveze, npr. frazema, donose se kao natuknice npr. ko (kao), po (pol/pola), zamaći, pored itd., ali se donosi i uputa na pravilan oblik npr. ko v. kao razg, pored v. pokraj, zamaći v. zamaknuti (zamaklo je /komu što/ za oko, proći pored /koga,čega/ kao pored turskoga groblja).

Slobodne sveze: ustaljene sveze riječi čije sastavnice imaju veću mogućnost kombiniranja s drugim riječima, a ne tvore sveze uskoga, odnosno ograničenoga značenjskog potencijala (npr. sunčan dan, dobar posao). Takve su sveze brojne u hrvatskome jeziku te se zbog toga donose i u Bazi.

Struktura baze

Baza sadržava 8 stupaca:

  1. Natuknica: kanonski oblik leme (donosi se kanonski oblik svake leme koja je sastavnica neke sveze (za imenicu se donosi imenica u nominativu, pridjev u nominativu muškoga roda, zamjenica u nominativu muškoga roda, glagol u infinitivu)
  2. Vrsta riječi (u početnoj fazi rada donosi se oznaka vrste riječi za homografne i homonimne natuknice (npr. luk im.1 / luk im.2; gl.1., gl.2., lak im. / lak prid.), prijedloge s oznakom padeža, neke veznike, a stupac će se postupno proširiti podatkom o vrsti riječi za svaku natuknicu)
  3. Oblik sveze: navode se primjeri različitih sveza riječi koje se donose pod svakom sastavnicom koja je dio pojedine sveze)
  4. Sinonimi i varijante: navode se različiti oblici sinonima (sinonimnih sveza i jednorječnih sinonima) te gramatičkih (pravopisnih, morfoloških i tvorbenih inačica) koje su također ustaljene u hrvatskome jeziku te se pojavljuju u različitim stilskim i komunikacijskim kontekstima
  5. Oznaka sveze: navodi se oznaka za vrstu sveze: S (kolokacija, gramatički frazem, koligacija, pragmem ili višerječni naziv), F (frazem), P (poslovica), bez oznake (slobodna sveza)
  6. Stil i struka: navodi se stilska i stručna odrednica za pojedine sveze čime se upućuje na uporabni kontekst u kojemu se sveza pojavljuje
  7.  Primjer: u nastavku rada na temelju pretrage korpusa unosit će se primjeri u kojima se pojedina sveza pojavljuje u širem kontekstu
  8. Značenje: u stupcu će se navoditi značenjska obilježja (višeznačnih) natuknica, sveza ili frazema ovisno o značenjskom potencijalu svake pojedine sveze ili natuknice.

Uputnice

U Bazi se pojedine natuknice ili sveze koje ne pripadaju neutralnoj, standardnojezičnoj upotrebi upućuju na drugu natuknicu ili svezu oznakom v. (vidi), npr. natuknica lažov upućuje se na natuknicu lažac ili se sveze nadležni sud, muzički instrument upućuju na sveze mjerodavni sud, glazbeni instrument. Uz pojedine natuknice ili sveze koje se upućuju na druge natuknice ili sveze u stupcu Stil i struka donosi se odrednica o stilskoj ili stručnoj upotrebi (nasuprot bolnice (razg.) v. nasuprot bolnici).

Upućuje se na pravopisno pravilne oblike koji se pišu sa spojnicom kao polusloženice, iako se u praksi često pojavljuju kao dvije riječi, dakle bez spojnice, npr. pizza majstor / pizza majstorica upućuje se na pizza-majstor / pizza-majstorica.

Sveze sa supletivnim oblicima i drugim morfološkim i paradigmatskim oblicima donose se pod kanonskim oblikom natuknice, ali su ti oblici navedeni u stupcu natuknica i upućuju se na kanonski oblik natuknice pod kojim se nalaze sveze u kojima su ti oblici sastavnice sveze, bolji v. dobar, oči v. oko, uši v. uho, gori v. zao itd., radni i trpni glagolski oblici pod infinitivom (npr. sveza doći kao naručen navodi se pod natuknicama doći, kao i naručiti. Iznimno, zbog lakšega snalaženja u Bazi, s obzirom na opsežan kolokacijski potencijal supletivni oblik ljudi navodi se kao samostalna natuknica.

Obilježavanje i povezivanje natuknica i sveza u Kolokacijskoj bazi

Za glagole, u kosim se zagradama bilježe osnovni rekcijsko-valencijski modeli (očarati /koga/ ljepotom), oštro prigovoriti /komu/) čime se, osim temeljnoga kolokacijskog oblika upućuje i na sintaktičku strukturu u kojoj se određena glagolska kolokacija ostvaruje. Uz ustaljene sintaktičke (koligacijske) sveze donosi se uglasta zagrada [ ] koja upućuje da iza te sveze slijedi drugi dio rečenice koji je promjenjiv, tj. ovisi o stvarnom komunikacijskom kontekstu, npr. uzimajući u obzir da [ ], kako sada stvari stoje [ ].

S obzirom na to da je sintagma osnovna jezična razina na kojoj se ostvaruju višerječne sveze, oblici sveza navode se malim početnim slovom. Takav zapis podrazumijeva da se većina sveza zapravo može uklopiti u veći cjelovit sintaktički niz. Velikim početnim slovom bilježe se samo sveze koje imaju obilježje višerječnoga imena (npr. Zemlja Izlazećega Sunca) ili poslovice (Besposlen pop i jariće krsti.) te ustaljeni pragmemi/usklici (A, što ja mogu!).

Osim primjera sveze u stupcu Sinonimi i varijante donose se jednorječnice ili sveze koje su također u upotrebi (npr. uz velike boginje u sinonimnome se stupcu navode i crne boginje te jednorječni sinonim variola), ali i morfološke i paradigmatske inačice (npr. ako je osim jedninskoga oblika u upotrebi i množinski oblik ili fonemska/morfemska inačica (npr. mliječni proizvod / mliječni proizvodi, vrhunsko vino / vrhunska vina, puno ime i prezime / punim imenom i prezimenom, vodotopivi koncentrat / vodotopljivi koncentrat, vrtoglava brzina / vrtoglavom brzinom, vukovi/vuci zavijaju). Uz perifrazne glagole koji se mogu zamijeniti jednorječnim glagolom taj se glagol navodi kao sinonim (npr. doći do zaključka / zaključiti).

Oblici glagolskih pridjeva koji su sastavnice kakve sveze, ako nisu leksikalizirani, ne navode se kao samostalna natuknica, nego se navode pod glagolskom natuknicom npr. trpni pridjev izbrojen koji je sastavnica frazema izbrojeni su /komu/ dani navodi se pod glagolom izbrojiti kao kanonskim oblikom natuknice. Leksikalizirani oblici glagolskih pridjeva trpnih koji su se s obzirom na kolokacijski potencijal osamostalili u upotrebi, iako mnogi od njih kao samostalne pridjevne natuknice nisu dosad zabilježeni ni u jednom rječniku hrvatskoga jezika, donose se kao samostalne natuknice (npr. pridjevi onečišćen (onečišćen zrak, onečišćen potok), mljeven (mljeveno meso, mljeveni papar) otegnut (otegnut govor/izgovor) itd. donose se u Bazi kao samostalne natuknice, a ne pod infinitivom glagola mljeti, onečistiti i otegnuti.

U Bazu su uvrštene i tipične koligacije tj. uobičajene sintaktičke strukture u hrvatskoj govorenoj i pisanoj praksi kojima se usmjerava komunikacija ili uvodi kakav sadržaj (s obzirom na činjenicu da [], žalosna je utjeha da, problem je u tome što [], olakšavajuća je okolnost []. Na taj se način donose primjeri upotrebe riječi i vrsta riječi (ponajprije glagola i nepunoznačnih riječi) koje nemaju velik kolokacijski potencijal, ali se primjenjuju u komunikacijskoj praksi.

Oznaka povr. u stupcu Vrsta riječi donosi se uz povratne glagole, ali i uz obezličene konstrukcije, zna se, priča se itd.

Neke sveze u hrvatskome imaju katkad više značenja, tj. pripadaju različitim višerječnim jedinicama te se i donose u svim značenjima. Npr. sveza vučja šapa navodi se i u doslovnom značenju i kao botanički naziv, uloviti zeca navodi se kao frazem i u doslovnome značenju, zasukati rukave navodi se kao frazem i doslovno, slijepa ulica navodi se kao kolokacija i kao frazem, slijepi putnik kao kolokacija i kako frazem, križni put kao frazem i kao naziv u religiji, odskočna daska kao frazem i kao sportsko pomagalo, odvrtjeti film kao frazem i običan primjer, plodno tlo u doslovnom i prenesenom značenju itd. ili različitoga broja, npr. zlatne rezerve (bank.) i zlatna rezerva (frazem), dignuti ruke od /koga, čega/ (frazem), dignuti ruku na /koga/ (frazem) dignuti ruku (‘javiti se’). Donose se kanonski oblici frazema (okrenuti /komu, čemu/ leđa i kontekstni oblici (zauvijek okrenuti leđa prošlosti), ali se donese sveze koje pripadaju žargonu određene struke, npr. sportske sveze: 1:0 za mene, dati/zabiti gol, osvojiti bod u gostima, zabiti autogol, zlatni gol, to je gol, to je autogol, živi zid,  spustiti loptu, igrati na prvu loptu, stati na loptu, umiriti loptu, ići kopačkom na nekoga, biti u niskom startu, igrati presing, igrati jedan na jedan, igrati flaster, igrati bunker, gužva u šesnaestercu).

Rekcija i valencija. U kosim se zagradama donose  osnovni valencijski (odgovoriti /komu/ na pitanje) i rekcijski modeli (npr. većinski vlasnik /čega/), tražiti odrješenje od /čega/, druga polovica /čega/ itd. čime korisnik dobiva informaciju od tome kojim prijedlozima ili padežima otvaraju mjesta riječi koje im upravljaju. Katkad rekcija upućuje na različita značenja npr. pogledati /koga, što/ kroz prste navodi se kao slobodna sveza, a pogledati /komu/ kroz prste kao frazem

Uz glagole se donose ustaljeni prijedlozi koji tvore glagolsko-prijedložnu ustaljenu svezu koja otvara mjesto imenskoj padežnoj dopuni (npr. doći do /čega/, uspjeti u /čemu/). Osim glagola, prijedložne se dopune donose i uz druge vrste riječi (ali i kod drugih riječi (zaljubljenik u /umjetnost, glazbu, prirodu/, nalik na /koga/, dobar na /majku/, više od /koga, čega/, vrijeme je za /koga, što/).

U svezama koje strukturom to zahtijevaju, donosi se i rekcijsko-valencijska dopuna u kosim se zagradama kako bi se, osim kanonskoga oblika sveze, uputilo na širi sintaktički i komunikacijski potencijal sveze koji se ostvaruje ovisno o kontekstu u kojemu se određena sveza upotrebljava (npr. pozvati /koga/ na rođendan, imati /koga, što/ na umu, većinski vlasnik /čega/). Na taj je način obuhvaćena i kategorija živosti, tj. donosi se podatak o živoj ili neživoj dopuni (imati utjecaj na /koga, što/, povisiti glas na /koga/, dignuti zajam za /što/, dobiti /što/ besplatno), što je, uz podatak o rekciji, iznimno korisno i važno u poučavanju hrvatskoga jezika kao stranoga/inoga. Uz sveze u kojima je to uobičajeno navode se rekcijske alternacije: doći /komu/ glave / doći /koga/ glave.

Homografi i homonimi. Imenice se označuju oznakom im., jedino kad je riječ o imenicama različita roda dodaje se odrednica roda npr. bol m. i bol ž. Homonimne i homografne natuknice razlikuju se prema oznaci za vrstu riječi (put im. ž., put im. m. i put prij. G), a ako natuknice pripadaju istoj vrsti riječi, uz oznaku vrste riječi uvodi se i brojčana oznaka (izvesti gl.1, izvesti gl.2).

Iznimno, uz odnosne i upitne zamjenice (tko, koji itd.) te čestice (kao) vrsta riječi nije obilježena prema morfološkome načelu nego prema sintaktičkoj funkciji.

Inačice. U bazi se inačice kanonskih oblika bez naveska (s, kroz, nad, niz, uz itd.) koje se pišu s naveskom na kraju (sa, kroza, nada, uza, niza) zbog lakšega snalaženja te da se korisniku jednostavnije prikažu sveze u kojima zbog početnoga slova drugih riječi dolazi oblik s naveskom.

Uz pravopisno preporučene inačice, donose se i dopuštene inačice jer su one uobičajena sastavnica pojedinih sveza, najčešće frazema (npr. uz frazem zavija /komu/ u želudcu donosi se i inačica zavija /komu/ u želucu jer je takav zapis uobičajen za taj frazem)

Pojedine sveze upućuju se na pravopisno preporučeni oblik, npr. vagon cisterna upućuje se na polusloženicu vagon-cisterna.

Literatura:

Baldwin, Timothy, Kim, Su Nam. 2009. Multiword expressions. Handbook of Natural Language Processing (2nd edition). Ur. Indurkhya, Nitin; Damerau, Fred J. CRC Press. Boca Raton: 1–39.

Benson, M., E. Benson, R. Ilson. 1997. The BBI dictionary of English word combinations. John Benjamins Publishing Co. Amsterdam – Philadelphia.

Blagus Bartolec, Goranka. 2012. Riječi i njihovi susjedi: Kolokacijske sveze u hrvatskom jeziku. Institut za hrvatski jezik i jezikoslovlje. Zagreb.

Firth, John R. 1957. A Synopsis of Linguistic Theory, 1930–1955. Studies in Linguistic Analysis. Special Volume. 1–32.

Ivir, Vladimir. 1992./1993. Kolokacije i leksičko značenje. Filologija 20–21. 181–189.

Mel’čuk, Igor. 1998. Collocations and Lexical Functions. Phraseology: Theory, Analysis and Applications. Ur. Cowie, Anthony Paul. Oxford University Press. Oxford – New York:  23–53. 

Menac, Antica, Fink-Arsovski, Željka i Radomir Venturin 2003. Hrvatski frazeološki rječnik. Naklada Ljevak. Zagreb.

Mihaljević, Milica. 1991. Višerječne natuknice i podnatuknice u jednojezičnom općem rječniku hrvatskoga jezika. Rasprave Instituta za hrvatski jezik i jezikoslovlje 17. 133–143.

Pintarić, Neda. 2002. Pragmemi u komunikaciji. Zavod za lingvistiku Filozofskoga fakulteta. Zagreb.

Pritchard, Boris. 1998. O kolokacijskom potencijalu rječničkog korpusa. Filologija 30–31. 285–304.

Ramisch, Carlos. 2015. Multiword Expressions Acquisition: A Generic and Open Framework. Theory and Applications of Natural Language Processing series XIV, Springer

Sag, Ivan A., Baldwin, Timothy, Bond, Francis Copestake, Ann i Dan Flickinger. 2002. Multiword expressions: A pain in the neck for NLP. Lecture notes in computer science 2276. 1–15.

Siepmann, Dirk. 2005. Collocation, Colligation and Encoding Dictionaries. Part II: Lexicographical Aspects. International Journal of Lexicography 19/1: 1–39.

Stojić, Aneta, Murica, Sanela. 2010. Kolokacije – teorijska razmatranja i primjena u praksi. Fluminensia 22/2: 111–125.

Škara, Danica. 1997. Glas tradicije. Ziral. Mostar – Zagreb.

Tafra, Branka. 2005. Od riječi do rječnika. Školska knjiga. Zagreb.

Turk, Marija. 2000. Višečlani izrazi s desemantiziranom sastavnicom kao nominacijske jedinice. Riječki filološki dani 3: Zbornik radova s Međunarodnoga znanstvenog skupa Riječki filološki dani. Ur. Stolac, Diana. Filozofski fakultet. Rijeka. 477–486.