Ta doktorska disertacija obravnava luščenje in poravnavo terminologije v prevajalski industriji. Osredotoča se na tri ključne primere rabe, kjer te tehnike koristijo prevajalcem in prevajalskim podjetjem: generiranje glosarjev za posamezne naročnike iz velikih paralelnih korpusov (tj. prevajalskih baz), gradnjo terminoloških virov iz primerljivih korpusov in prepoznavanje relevantnih domenskih terminov v …
Disertacija predstavi novo strategijo kombiniranja nevronskih in simbolnih reprezentacij, s katero želimo preseči omejitve pristopov, ki temeljijo le na eni vrsti reprezentacij. S pomočjo predlaganega pristopa nam uspe razviti množico novih metod in tekstovnih reprezentacij za reševanje nalog s področja procesiranja naravnega jezika. Uporabnost strategije je prikazana na treh primerih, …
Disertacija obravnava formalizacijo in implementacijo procesa za polavtomatsko gradnjo ontologij. Predlagamo teoretični okvir za formalizacijo procesa polavtomatske gradnje ontologij. Proces je predstavljen kot zaporedje operatorjev, uporabljenih na ontologijo. Identificirani so pogosti tipi operatorjev, pri čemer je vsak od njih operator posplošen do mere, potrebne za odkritje operatorja s kombinacijo metod …
Skladenjsko razčlenjevanje na področju jezikovnih tehnologij predstavlja enega od vmesnih korakov analize besedila v aplikacijah, kot so strojno prevajanje, luščenje informacij, odgovarjanje na vprašanja itd. Za opis strukture povedi se pogosto uporablja skladenjska drevesa. Posebna vrsta skladenjskega razčenjevanja je odvisnostno razčlenjevanje. Razčlenjevalniki iz besedila zgradijo drevesa. Pri podatkovno orientiranem razčlenjevanju …