Projekti koje financira HRZZ

Semantičko-sintaktička klasifikacija glagola u hrvatskom jeziku (SEMTACTIC)

Voditelj: Ivana Brač

O projektu

Semantičko-sintaktička klasifikacija glagola u hrvatskom jeziku SEMTACTIC

Projekt financira: Hrvatska zaklada za znanost

Šifra projekta: IP-2022-10-8074

Matična ustanova: Institut za hrvatski jezik

Trajanje projekta: 31. prosinca 2023. – 30. prosinca 2027.

Mrežna stranica projekta: semtactic.jezik.hr


Suradnici na projektu:

dr. sc. Mia Batinić Angster, Odjel za lingvistiku Sveučilišta u Zadru

dr. sc. Matea Birtić, Institut za hrvatski jezik

prof. dr. sc. Branimir Belaj, Filozofski fakultet Sveučilišta Josip Juraj Strossmayer u Osijeku

dr. sc. Ivana Brač, Institut za hrvatski jezik, voditeljica projekta

Daria Lazić, Institut za hrvatski jezik

Maja Matijević, Institut za hrvatski jezik

dr. sc. Iva Nazalević Čučević, Filozofski fakultet Sveučilišta u Zagrebu

dr. sc. Ana Ostroški Anić, Institut za hrvatski jezik

Siniša Runjaić, Institut za hrvatski jezik

dr. sc. Kristina Štrkalj Despot, Institut za hrvatski jezik



Sažetak projekta:

Sintaktičko-semantička analiza glagola kao najvažnijega elementa u rečenici koji određuje broj, vrstu i značenjske karakteristike drugih elemenata koji se mogu pojaviti u rečenici važna je u različitim područjima primjene. Od 80-ih godina 20. st. mnoge teorije polaze od toga da je sintaktička realizacija argumenata, odnosno njihove kategorije i gramatička funkcija, predvidljiva iz značenja glagola. To je iznimno važno za učenje jezika zbog pretpostavke da neizvorni govornik može predvidjeti sintaktički obrazac glagola unutar određene semantičke skupine ako zna sintaktički obrazac prototipnih glagola te semantičke skupine. Odnos sintakse i semantike važan je ujedno za automatsko označivanje sintaktičkih kategorija i semantičkih uloga u obradi prirodnoga jezika.

Ciljevi su projekta odrediti semantičke skupine kojima pripada 500 najčešćih glagola u hrvatskom jeziku, njihove prototipne sintaktičke obrasce i semantičke uloge, teorijski istražiti odnos semantike i sintakse hrvatskih glagola unutar jedne semantičke skupine i među skupinama. Jednako je važan rezultat projekta i baza u kojoj će se odrediti značenja glagola, svakomu značenju bit će pridružena semantička skupina te će na temelju primjera iz korpusa biti određena vrsta dopune i semantička uloga.

U okviru projekta istraživat će se semantička obilježja glagola, tj. odnosi sinonimije, antonimije, troponimije i dr., zatim uloga glagola u kognitivnim mehanizmima metafore i metonimije te će se istraživati sintaktičke alternacije i druge gramatičke pojave.

Podjelom glagola u semantičke skupine i njihovim valencijskim opisom uočit će se sličnosti i razlike među glagolima jedne skupine te između različitih skupina, što će rezultirati boljim razumijevanjem odnosa sintakse i semantike. Strukturirano i pregledno prikazani rezultati u bazi i u radovima omogućit će bolje uključivanje hrvatskoga jezika u poredbena istraživanja te moguću razmjenu istovrsnih podataka s drugim bazama podataka koje se temelje na istom ili sličnom načelu razdiobe. Projekt je važan za obradu prirodnoga jezika zbog pouzdanoga i temeljitoga opisa sintaktičkih obrazaca i semantičkih uloga te diferenciranih značenja, stoga će se rezultati moći koristiti za parsiranje, automatsko označivanje teksta, označivanje semantičkih uloga, unapređenje alata za strojno prevođenje, izradu materijala za učenje jezika i dr. Rezultati će koristiti profesorima hrvatskoga jezika, studentima svih jezičnih smjerova, hrvatskim i stranim lingvistima te neizvornim govornicima kako bi svladali prenošenje obrazaca iz materinskoga u ini jezik. Baza će se dopunjavati i dorađivati i nakon završetka projekta, s ciljem da bude baza s najviše opisanih glagola u hrvatskom jeziku.


Semantic-syntactic classification of Croatian verbs

The project’s goals are to determine the semantic classes to which the 500 most frequent verbs in the Croatian language belong, along with their prototype syntactic patterns and semantic roles. The project aims to theoretically explore the relationship between the semantics and syntax of Croatian verbs within a semantic class and across classes. An equally important result is a database that will contain a detailed description of verbs’ argument structure. Each verb sense will be associated with a semantic class, and based on examples from the corpora, the type of complement and semantic role will be determined. The project will investigate the semantic features of verbs, such as synonymy, antonymy, troponymy, etc. Additionally, it will explore the role of verbs in cognitive mechanisms such as metaphor and metonymy, as well as syntactic alternations and other grammatical phenomena. By categorizing verbs into semantic classes and providing valency descriptions, similarities and differences among verbs within a semantic class and between different classes will be observed. That will lead to a better understanding of the relationship between syntax and semantics. The structured and clear presentation of results in the database and publications will facilitate the integration of the Croatian language into comparative research and potential data exchange with other similar databases. The project is crucial for natural language processing due to its reliable and thorough description of syntactic patterns, semantic roles, and differentiated verbs’ senses. The results can be used for parsing, automatic text annotation, semantic role labeling, improving machine translation tools, creating language learning materials, etc. The outcomes will benefit Croatian language professors, students of all linguistic disciplines, Croatian and foreign linguists, and non-native speakers. The database will continue to be updated even after the project's completion, with the goal of becoming the most comprehensive database of verbs in the Croatian language.



Suradnici na projektu

Rođena je 1984. godine u Vukovaru. Studij kroatistike i filozofije završila je 2009. na Filozofskom fakultetu u Zagrebu te poslijediplomski doktorski studij lingvistike 2017. na istom fakultetu. Od 2009. do 2011. ra...

Pročitaj više

Maja Matijević rođena je 9. prosinca 1994. godine u Požegi. Kroatistiku i informacijske znanosti na Filozofskome fakultetu Sveučilišta u Zagrebu upisala je 2013. godine i preddiplomski studij završila 2016. Jezikos...

Pročitaj više

English CV in EuropassDiplomirala 2005. engleski jezik i književnost i hrvatski jezik i književnost na Filozofskom fakultetu u Zagrebu. Godine 2015. doktorirala je na poslijediplomskom doktorskom studiju lingvistike di...

Pročitaj više

Rođen je 12. studenoga 1972. u Sisku. Osnovnu školu i gimnaziju završio je u rodnome gradu. Na Filozofskome fakultetu Sveučilišta u Zagrebu 14. srpnja 1999. stekao je diplomu iz opće lingvistike i komparativne knji...

Pročitaj više

CV in EnglishKristina Štrkalj Despot diplomirala je 2002. i doktorirala 2007. godine na Filozofskome fakultetu u Zagrebu unutar 10 % najboljih studenata. Od 2003. godine radi u Institutu za hrvatski jezik. Zvanje znanst...

Pročitaj više

Pravopis

pravopis.hr

Gramatika

gramatika.hr

Savjetnik

jezicni-savjetnik.hr

Bolje.hr

bolje.hr

Hrvatski u školi

hrvatski.hr

Riznica

riznica.ihjj.hr

Nazivlje

nazivlje.hr

Matura

matura.ihjj.hr

Frazemi

frazemi.ihjj.hr

Valencije

valencije.ihjj.hr

Kolokacije

ihjj.hr/kolokacije/

Metafore

ihjj.hr/metafore/