Paralelni korpus InterCorp

Paralelni korpus InterCorp polaznicima je predstavio profesor Karel Jirásek. Od 1991. godine bavi se prostorom bivše Jugoslavije, njezinom poviješću, kulturom i jezicima. Osim toga usredotočuje se na društveno-kulturni kontekst jezika na svim njegovim razinama uključujući dijalekte. Studirao je hrvatsku i slovensku filologiju, koju danas predaje na Filozofskome fakultetu u Pragu.

InterCorp projekt je pokrenut 2005, a prva je inačica objavljena 2008. Svake godine nastaje nova proširena verzija i projekt ih trenutno broji četrnaest. Riječ je o korpusu u kojemu je zastupljen 41 jezik, a svi su međusobno povezani češkim jezikom. Sadrži uglavnom beletrističke i publicističke tekstove, filmske titlove i prijevode Biblije. Za prijevode na hrvatski jezik zaslužan je upravo profesor Jirásek. Strukturu hrvatske sastavnice paralelnog korpusa čine hrvatski izvorni tekstovi s prijevodom na češki (37 knjiga), češki izvornici s prijevodom na hrvatski (100 knjiga) te izvornici na trećim jezicima s prijevodom na češki i hrvatski (169 knjiga). Profesor naglašava kako prijevodi s trećih jezika na hrvatski i češki omogućuju međujezično povezivanje, svojevrsnu sinergiju jezika, onemogućuju utjecaj sličnosti među srodnim jezicima na prijevode. Između ostalog ti se prijevodi nerijetko odlikuju i boljom kvalitetom od onih s češkoga na hrvatski i obrnuto – načelno je riječ o tzv. velikim jezicima s kojih i na koje prevodi veći broj prevoditelja.

Takav paralelan korpus izrazito je koristan za proučavanje jezika, leksikografiju, praćenje jezičnih promjena u vremenu, istraživanje frazema i za komparativna jezična istraživanja na svim razinama (leksik, sintaksa, frazeologija, teorija prevođenja). Kao primjer primjene navodi sinonimske nizove na temelju kojih se može zaključiti o ekvivalentnosti i slično te stanje jezičnih pojava i njihove promjene u vremenu, npr. detektiranje upotrebe suprotnih veznika i davanje preciznih odgovora na pitanja kao što su Koji (npr.) češki veznici odgovaraju hrvatskim suprotnim veznicima (i obrnuto)? ili Koji leksemi odgovaraju hrvatskome leksemu lijep u kojemu od jezika. Osim toga analiza korpusa može identificirati „lažne prijatelje“ u jezicima, odnosno netočne „ekvivalente“ (hrv. žalba vs. češ. žaloba; hrv. baviti se vs. češ. bavit se), lekseme koji imaju (potpuno) drukčije značenje u dvama jezicima, ali su izrazno slični ili isti; usto su razvidne moguće zamjene odgovarajućim leksemima, pričem se pokazuje i čestotnost porabe svakoga.

Anamarija Mrkonjić