Ogledi: 8 | Prenosi: 12
V disertaciji obravnavamo nalogo polinomske regresije, t.j. indukcijo regresijskih modelov,
ki temeljijo na polinomskih enačbah, iz podatkov. Naš cilj je namreč izboljšanje in razširitev
obstoječih pristopov za učenje modelov polinomske regresije v več smereh. Najprej smo
izboljšali obstoječe metode za obravnavanje problema pretiranega prilagajanja (angl. overfitting)
kot tudi obstoječe metode za urejanje preiskovanega prostora polinomskih enačb.
Nato smo razširili področje uporabe obstoječih metod polinomske regresije z učenjem odsekoma
polinomskih modelov, večciljnih polinomskih modelov in polinomskih modelov za
klasifikacijo z regresijo (angl. classification via regression). Osrednja hipoteza disertacije je,
da bodo izboljšave in razširitve obstoječih pristopov izboljšale učinkovitosti oz. uspešnost
polinomskih modelov na nalogah regresije in klasifikacije. Prav tako domnevamo, da bo njihova
uspešnost primerljiva z uspešnostjo modelov, dobljenih z drugimi sodobnimi pristopi
k regresiji in klasifikaciji.
Za doseganje ciljev in preskus hipoteze smo najprej pregledali obstoječe raziskave na
področju učenja regresijskih modelov, s poudarkom na metrikah vrednotenja, ki se jih uporablja
za regresijske modele. Nato smo razvili nove hevristike in izboljšane operatorje dodelave
(angl. refinement operators) in jih vgradili v algoritem Ciper za učenje polinomskih
regresijskih modelov. Algoritem je sposoben učenja odsekoma polinomskih in večciljnih
polinomskih modelov kot tudi polinomskih modelov za razvrščanje oz. klasifikacijo z regresijo.
Na koncu smo empirično ovrednotili in primerjalno analizirali uspešnost polinomskih
modelov, dobljenih z algoritmom Ciper, in uspešnost modelov, dobljenih z drugimi pristopi.
Rezultati empirične ocene in primerjalne analize kažejo, da na novo razvite preiskovalne
hevristike in izboljšani operatorji dodelave vodijo do izboljšanja učinkovitosti naučenih regresijskih
modelov. Uspešnost modelov, naučenih z algoritmom Ciper, je primerljiva z
uspešnostjo modelov, dobljenih z drugimi pogosto uporabljanimi regresijskimi algoritmi.
Prav tako imajo modeli za klasifikacijo z regresijo, ki temeljijo na večciljnih polinomih, napovedno
uspešnost primerljivo z uspešnostjo modelov, dobljenih z drugimi klasifikacijskimi
pristopi. Na koncu smo tudi pokazali, da so odsekoma polinomski modeli z omejeno stopnjo
primerljivi s polinomskimi modeli višje stopnje.
Prispevek disertacije k področju strojnega učenja je nov algoritem strojnega učenja za
indukcijo regresijskih modelov, ki temeljijo na polinomskih enačbah. Algoritem je skrbno
zasnovan z analizo ter primerjavo uspešnosti različnih metod za generiranje in vrednotenje
kandidatskih enačb. Algoritem razširja tudi področje polinomske regresije z učenjem odsekoma
polinomskih in večciljnih polinomskih regresijskih modelov, ki lahko služijo tudi za
reševanje klasifikacijskih nalog v skladu s pristopom klasifikacije z regresijo.