Nagel razvoj strojnega učenja in optimizacije črnih skrinjic je privedel do večje odvisnosti od primerjalnih podatkov za vrednotenje in primerjavo algoritmov na različnih področjih, vendar pa učinkovito izkoriščanje teh podatkov otežujejo izzivi, kot so sintaktična raznolikost, semantična dvoumnost in pomanjkanje standardizacije. Pričujoča disertacija se ukvarja s temi izzivi in zagovarja …
V disertaciji predstavljamo nove metode za odkrivanje enačb (ang. equation discovery, ED), ki temeljijo na uporabi verjetnostnih gramatik. ED in simbolna regresija obravnavata problem iskanja simbolnega matematičnega modela, ki najbolje opisuje izmerjene podatke. Modeli so lahko različnih oblik, od preproste algebrajske enačbe do kompleksnega sistema diferencialnih enačb. Tradicionalno znanstveniki enačbe …
Večina metod za podatkovno rudarjenje, strojno učenje in statistično analizo podatkov temelji na predpostavki, da so podatki neodvisni in enako porazdeljeni (ang. independent and identically distributed – i.i.d.). To pomeni, da morajo biti učni primeri med seboj neodvisni ter imeti enako verjetnostno porazdelitev. Vendar so primeri, ko podatki niso i.i.d., …
Disertacija obravnava nalogo učenja modelov za napovedovanje strukturiranih vrednosti, ki kot vhod vzamejo vektor vrednosti značilk in na izhodu podajo napoved strukturirane vrednosti. Za razliko od klasifikacije in regresije, kjer je na izhodu ena sama skalarna vrednost, je v našem primeru izhod, oziroma napoved, podatkovna struktura kot na primer vektor …