Velika prepreka stvaranju hrvatskih povijesnih jezičnih resursa jest povijesna tropismenost, a unutar nje posebno složenost latiničnih grafija. Predloženim projektom razvit će se model kojim će se prevladati navedeni problem, što će pokazati put do bržeg stvaranja povijesnojezičnih korpusa te posljedično ubrzati i inače mukotrpnu tekstološku produkciju. U korpus za analizu uključit će se dovoljno digitaliziranih starih latiničnih knjiga kako bi se došlo do brojke od milijun pojavnica, a među njima će se naći i neke gramatike. Knjige će se digitalizirati u izvornoj grafiji s pomoću OCR-a (optical character recognition) uz provođenje procedure koja će znatno umanjiti mogućnost pogrešaka u digitaliziranoj građi. Projekt će iznjedriti vjerno digitalizirane knjige visoke kvalitete (kvalitetu kontroliraju iskusni filolozi, a ne samo tehnički osposobljeno osoblje).
Postoji znatna literatura o hrvatskoj povijesnoj latiničnoj grafiji, ali ovaj će se projekt nadograditi na nju te je dopuniti preciznim grafematičkim opisima primjerenijim za računalnu praktičnu primjenu. Očekuje se da će se rezultati projekta, a ponajprije predviđeni korpus, uspješno dopunjavati s postojećim vrijednim („analognim” i digitalnim) resursima kao što su Akademijin rječnik i Rječnik hrvatskoga kajkavskoga književnog jezika. S tim u vezi projekt će surađivati s drugim institutskim (tekstološkim) projektima, koji će se i u budućnosti moći trajno služiti njegovim rezultatima.
Za korpus su izabrane sljedeće knjige:
Josip Banovac, Predike od svetkovina došašća Isukrstova, 1759. (zastupljena u AR; već u cijelosti digitalizirana)
Josip Banovac, Blagosov od polja, 1767. (zastupljena u AR)
Nikola Dešić, Raj duše, 1560. (nezastupljena u AR)
Hrvatski protestanti, Proroci, 1564. (zastupljena u AR, ali prema izdanju Vatroslava Jagića)
Šime Starčević – Nova ričoslovica ilirička, 1812. (nezastupljena u AR; već u cijelosti digitalizirana)
Bartol Kašić – Vanđelja i pistule, 1641. (nezastupljena u AR)
Bartol Kašić – Pismo od nasledovanja Gospodina našega Jezusa, 1641. (zastupljena u AR; digitalizacija se obavlja u okviru drugoga institutskog projekta De imitatione Christi na trima stilizacijama hrvatskoga književnog jezika)
Ivan Krištolovec, Od nasleduvanja Kristuševoga, 1710. (zastupljena u KR, ali prema izdanju iz 1760.; digitalizacija se trenutačno obavlja u okviru drugoga institutskog projekta De imitatione Christi na trima stilizacijama hrvatskoga književnog jezika)
Marko Marulić, prvih pet izdanja Judite (1521., 1522., 1523., 1586., 1627.), što ih ovdje zbog relativno male veličine sve brojimo kao jednu knjigu (zastupljena u AR, ali samo prema izdanju iz edicije Starih pisaca hrvatskih)
Ivan Pergošić, Decretum, 1574. (zastupljena u KR, ali prema kritičkom izdanju iz 1909.; osobito izazovna za razvoj modela zbog mnogo teksta na njemačkome jeziku)
Matija Antun Relković – Nova slavonska i nimačka gramatika, 1767. (nezastupljena u AR)
[Dodatna knjiga iz koje će se preuzeti dovoljno teksta ako bude potrebe da se postigne veličina korpusa od milijun pojavnica jest: Anton Dalmatin i Stipan Konzul, Postila, 1568. (zastupljena u AR, ali prema glagoljičnoj inačici iz 1562.)]
Projekt financira Europska unija iz fonda NextGenerationEU.
Rođen 1981. u Beogradu. Osnovnu školu pohađa u Beogradu i Žrnovnici, a opću gimnaziju završava u Splitu. Diplomirao u travnju 2008. hrvatski jezik i književnost na Odjelu za kroatistiku i slavistiku Sveučilišta ...
Pročitaj višeMarijana Horvat završila je program studija hrvatskoga jezika na Filozofskom fakultetu Sveučilišta u Zagrebu te diplomirala 1990. godine na Katedri za suvremeni hrvatski književni jezik. Na istom je fakultetu 1997. g...
Pročitaj više
Pravopispravopis.hr |
Gramatikagramatika.hr |
Savjetnikjezicni-savjetnik.hr |
Bolje.hrbolje.hr |
Hrvatski u školihrvatski.hr |
Riznicariznica.ihjj.hr |
Nazivljenazivlje.hr |
Maturamatura.ihjj.hr |
Frazemifrazemi.ihjj.hr |
Valencijevalencije.ihjj.hr |
Kolokacijeihjj.hr/kolokacije/ |
Metaforeihjj.hr/metafore/ |