Gradnja značilk, ki vključuje tako ročno zasnovo s strani domenskih strokovnjakov kot tudi avtomatizirano učenje uporabnih predstavitev podatkov, je ključen vidik strojnega učenja. Glavni cilj je pretvoriti surove podatke v obliko, ki jo lahko učinkoviteje izkoristimo s pristopi strojnega učenja. Čeprav je gradnja značilk dobro raziskana na področjih kot sta …
Ta doktorska disertacija obravnava luščenje in poravnavo terminologije v prevajalski industriji. Osredotoča se na tri ključne primere rabe, kjer te tehnike koristijo prevajalcem in prevajalskim podjetjem: generiranje glosarjev za posamezne naročnike iz velikih paralelnih korpusov (tj. prevajalskih baz), gradnjo terminoloških virov iz primerljivih korpusov in prepoznavanje relevantnih domenskih terminov v …
Ekološke, kmetijske in biološke discipline se soočajo z vse večjimi izzivi, kot so izguba biotske raznovrstnosti, motnje v prehranjevalnih verigah in podnebne spremembe, zato postaja uporaba strojnega učenja za obdelavo kompleksnih in heterogenih podatkov vse bolj pomembna. Disertacija raziskuje potencial strojnega učenja v kombinaciji z razlagalnimi pristopi za izboljšanje raziskav …
S hitrim razvojem senzorskih tehnologij, še posebej v okviru interneta stvari (IoT), smo vstopili v obdobje, ki ga zaznamujejo velike količine podatkov, ki so na voljo v realnem času. S tem so nastale potrebe po novih metodah obdelave podatkov, ki omogočajo prehod od tradicionalne paketne (batch) analize do uporabe metod …
V disertaciji predstavljamo nove metode za odkrivanje enačb (ang. equation discovery, ED), ki temeljijo na uporabi verjetnostnih gramatik. ED in simbolna regresija obravnavata problem iskanja simbolnega matematičnega modela, ki najbolje opisuje izmerjene podatke. Modeli so lahko različnih oblik, od preproste algebrajske enačbe do kompleksnega sistema diferencialnih enačb. Tradicionalno znanstveniki enačbe …
Opis in označba notranjega radijskega okolja (RE) je predpogoj za napredek pri načrtovanju in optimizaciji brezžičnih omrežij naslednje generacije v notranjih okoljih ter za izgradnjo digitalnega dvojčka stavbe. Potreba po celoviti in natančni oceni in označbi notranjega RE bo še posebej očitna v prihodnjem hiper-povezanem mešanem realno-virtualnem svetu, kjer bodo …
Onesnažila, ki vzbujajo nastajajočo zaskrbljenost (CEC), so tipične organske spojine naravnega ali sintetičnega izvora ter produkti njihove razgradnje in pretvorbe (TP) s potencialno škodljivimi učinki na človeka, bioto in okolje. Te spojine so izjemno pomemben del eko-ekspozoma (EE). Njihova identifikacija in kvantifikacija ter raziskovanje njihovega okoljskega obnašanja bistveno večajo naše …
Obujeno področje globokega učenja je v zadnjem desetletju ponudilo pristope, ki postajajo ključni sestavni deli sodobnih inteligentnih sistemov. Poleg učinkovitosti je za te metode značilna tudi njihova sposobnost procesiranja večjih količin podatkov (skaliranje). Glavni pomanjkljivosti globokega učenja sta neinterpretabilnost ter nezmožnost direktne izrabe uporabnega simbolnega predznanja. Veja strojnega učenja, ki …
Večina metod za podatkovno rudarjenje, strojno učenje in statistično analizo podatkov temelji na predpostavki, da so podatki neodvisni in enako porazdeljeni (ang. independent and identically distributed – i.i.d.). To pomeni, da morajo biti učni primeri med seboj neodvisni ter imeti enako verjetnostno porazdelitev. Vendar so primeri, ko podatki niso i.i.d., …
Skladenjsko razčlenjevanje na področju jezikovnih tehnologij predstavlja enega od vmesnih korakov analize besedila v aplikacijah, kot so strojno prevajanje, luščenje informacij, odgovarjanje na vprašanja itd. Za opis strukture povedi se pogosto uporablja skladenjska drevesa. Posebna vrsta skladenjskega razčenjevanja je odvisnostno razčlenjevanje. Razčlenjevalniki iz besedila zgradijo drevesa. Pri podatkovno orientiranem razčlenjevanju …