Gradnja značilk, ki vključuje tako ročno zasnovo s strani domenskih strokovnjakov kot tudi avtomatizirano učenje uporabnih predstavitev podatkov, je ključen vidik strojnega učenja. Glavni cilj je pretvoriti surove podatke v obliko, ki jo lahko učinkoviteje izkoristimo s pristopi strojnega učenja. Čeprav je gradnja značilk dobro raziskana na področjih kot sta …
Nagel razvoj strojnega učenja in optimizacije črnih skrinjic je privedel do večje odvisnosti od primerjalnih podatkov za vrednotenje in primerjavo algoritmov na različnih področjih, vendar pa učinkovito izkoriščanje teh podatkov otežujejo izzivi, kot so sintaktična raznolikost, semantična dvoumnost in pomanjkanje standardizacije. Pričujoča disertacija se ukvarja s temi izzivi in zagovarja …
Bolezni srca in žilja ali kardiovaskularne bolezni (KVB) so vodilni vzrok smrti v svetu. Močno vplivajo na kakovost življenja bolnikov in predstavljajo precejšno obremenitev za zdravstvene sisteme. Povečevanje pojavnosti kroničnega srčnega popuščanja (KSP), ki je pogosta posledica KVB, predstavlja naraščajočo obremenitev za zdravje ljudi. Natančna in zgodnja identifikacija KVB je …
Samodejno luščenje terminologije (SLT) oz. samodejno luščenje terminov je naloga obdelave naravnega jezika (ONJ), ki identificira specializirano terminologijo v domenskih korpusih. SLT se ne uporablja le pri terminografskih nalogah (npr. ustvarjanje specializiranih slovarjev), temveč omogoča tudi izboljšavo več drugih kompleksnih nalog s področja ONJ (npr. strojno prevajanje in luščenje informacij). …
V tej doktorski disertaciji predstavljamo novo metodologijo strojnega učenja za avtomatsko dodeljevanje metapodatkov digitaliziranim predmetom kulturne dediščine. Kulturna dediščina je primer področja, ki zahteva strokovno označevanje, z malo že obstoječih označenih zbirk podatkov in kjer je pridobivanje dodatnih označenih podatkov izziv. Družbena pomembnost kulturne dediščine leži v njeni vlogi pri …
Cilj prizadevanj za avtonomno učenje robotov je omogočiti robotom, da se nemoteno vključijo v naše vsakdanje življenje ter povečajo našo učinkovitost in udobje. Po drugi strani pa ima v industrijskem sektorju avtonomno učenje robotov ključno vlogo pri sledenju hitro razvijajočim se zahtevam trga. Ker se izdelki in procesi hitro spreminjajo, …
Obujeno področje globokega učenja je v zadnjem desetletju ponudilo pristope, ki postajajo ključni sestavni deli sodobnih inteligentnih sistemov. Poleg učinkovitosti je za te metode značilna tudi njihova sposobnost procesiranja večjih količin podatkov (skaliranje). Glavni pomanjkljivosti globokega učenja sta neinterpretabilnost ter nezmožnost direktne izrabe uporabnega simbolnega predznanja. Veja strojnega učenja, ki …
Zaradi narave brezžičnega prenosnega medija je za brezžične komunikacije značilna večja verjetnost izgube podatkovnih paketov kot pri žičnih komunikacijah. Kakovost brezžičnih povezav je močno odvisna od spreminjajočih razmer na kanalu, medsebojnih motenj in tudi pomanjkljivosti primopredajnika. Nezanesljivost brezžičnih povezav je spodbudila razvoj številnih tehnik, ki lahko kljubujejo takšnim pogojem s …
Večina metod za podatkovno rudarjenje, strojno učenje in statistično analizo podatkov temelji na predpostavki, da so podatki neodvisni in enako porazdeljeni (ang. independent and identically distributed – i.i.d.). To pomeni, da morajo biti učni primeri med seboj neodvisni ter imeti enako verjetnostno porazdelitev. Vendar so primeri, ko podatki niso i.i.d., …
V disertaciji obravnavamo nalogo polinomske regresije, t.j. indukcijo regresijskih modelov, ki temeljijo na polinomskih enačbah, iz podatkov. Naš cilj je namreč izboljšanje in razširitev obstoječih pristopov za učenje modelov polinomske regresije v več smereh. Najprej smo izboljšali obstoječe metode za obravnavanje problema pretiranega prilagajanja (angl. overfitting) kot tudi obstoječe metode …