Ta doktorska disertacija obravnava luščenje in poravnavo terminologije v prevajalski industriji. Osredotoča se na tri ključne primere rabe, kjer te tehnike koristijo prevajalcem in prevajalskim podjetjem: generiranje glosarjev za posamezne naročnike iz velikih paralelnih korpusov (tj. prevajalskih baz), gradnjo terminoloških virov iz primerljivih korpusov in prepoznavanje relevantnih domenskih terminov v …
Samodejno luščenje terminologije (SLT) oz. samodejno luščenje terminov je naloga obdelave naravnega jezika (ONJ), ki identificira specializirano terminologijo v domenskih korpusih. SLT se ne uporablja le pri terminografskih nalogah (npr. ustvarjanje specializiranih slovarjev), temveč omogoča tudi izboljšavo več drugih kompleksnih nalog s področja ONJ (npr. strojno prevajanje in luščenje informacij). …
Disertacija predstavi novo strategijo kombiniranja nevronskih in simbolnih reprezentacij, s katero želimo preseči omejitve pristopov, ki temeljijo le na eni vrsti reprezentacij. S pomočjo predlaganega pristopa nam uspe razviti množico novih metod in tekstovnih reprezentacij za reševanje nalog s področja procesiranja naravnega jezika. Uporabnost strategije je prikazana na treh primerih, …
Skladenjsko razčlenjevanje na področju jezikovnih tehnologij predstavlja enega od vmesnih korakov analize besedila v aplikacijah, kot so strojno prevajanje, luščenje informacij, odgovarjanje na vprašanja itd. Za opis strukture povedi se pogosto uporablja skladenjska drevesa. Posebna vrsta skladenjskega razčenjevanja je odvisnostno razčlenjevanje. Razčlenjevalniki iz besedila zgradijo drevesa. Pri podatkovno orientiranem razčlenjevanju …