Radon (222Rn, razpolovni čas 3,82 dni) je naraven radioaktiven žlahten plin, ki nastaja z radioaktivnim razpadom iz radija (226Ra) v zemeljski skorji. Poleg škodljivega vpliva sevanja na zdravje ljudi lahko radon uporabljamo kot orodje v geofizikalnih raziskavah. Pri uporabi radona kot sledila različnih geofizikalnih procesov je zelo pomembno dobro poznavanje …
Večina metod za podatkovno rudarjenje, strojno učenje in statistično analizo podatkov temelji na predpostavki, da so podatki neodvisni in enako porazdeljeni (ang. independent and identically distributed – i.i.d.). To pomeni, da morajo biti učni primeri med seboj neodvisni ter imeti enako verjetnostno porazdelitev. Vendar so primeri, ko podatki niso i.i.d., …
V disertaciji obravnavamo nalogo polinomske regresije, t.j. indukcijo regresijskih modelov, ki temeljijo na polinomskih enačbah, iz podatkov. Naš cilj je namreč izboljšanje in razširitev obstoječih pristopov za učenje modelov polinomske regresije v več smereh. Najprej smo izboljšali obstoječe metode za obravnavanje problema pretiranega prilagajanja (angl. overfitting) kot tudi obstoječe metode …
V disertaciji obravnavamo problem učenja različnih vrst odločitvenih dreves na podlagi podatkovnih tokov, ki se spreminjajo v času. Posebej se posvetimo študiju sprotnih (online) algoritmov strojnega učenja za učenje regresijskih dreves, linearnih modelnih dreves, opcijskih dreves za regresijo, več-kriterijskih modelnih dreves in ansamblov modelnih dreves na podlagi podatkov iz časovnih …
Urejanje značilk (ang. feature ranking) je naloga strojnega učenja pri kateri želimo značilke iz dane množice podatkov urediti glede na neko mero pomembnosti. V disertaciji obravnavamo urejanje značilk v okviru nadzorovanega učenja, zato je pojem pomembnosti značilk opredeljen glede na ciljni koncept. Urejanje značilk je le redko obravnavano kot samostojna …
Ali je mogoče zaupati modelu, zgrajenem z algoritmi strojnega učenja in rudarjenja podatkov? Znano je, da lahko model v obliki odločitvenega drevesa vsebuje slabe, tj. manj verodostojne dele, ki jih povzročajo patološko obnašanje indukcijskih algoritmov, šum in manjkajoče vrednosti v podatkih, lahko pa se pojavijo tudi zaradi kompleksnosti domene. Takšni …
Disertacija obravnava formalizacijo in implementacijo procesa za polavtomatsko gradnjo ontologij. Predlagamo teoretični okvir za formalizacijo procesa polavtomatske gradnje ontologij. Proces je predstavljen kot zaporedje operatorjev, uporabljenih na ontologijo. Identificirani so pogosti tipi operatorjev, pri čemer je vsak od njih operator posplošen do mere, potrebne za odkritje operatorja s kombinacijo metod …
Simulacijski modeli so pogosto uporabljeno orodje za modeliranje in simuliranje siste- mov, za katere je težko pridobiti realne podatke. Ker so simulacijski modeli kompleksni, ni enostavno generirati novega znanja in iskati relacij in odvisnosti med različnimi deli (parametri, procesi, moduli) simulacijskega modela. Predhodni poskusi analiziranja izhodnih podatkov iz simulacijskih modelov …
Analiza podatkov z metodami strojnega učenja omogoča, da iz velikih količin podatkov v podatkovnih bazah izluščimo delčke znanja, ki obravnavani skupaj morda opisujejo še nepoznane povezave med pojavi. Skupaj obravnavana, dotlej nepovezana spoznanja tako prispevajo k novim hipotezam na različnih področjih, med katerimi je že dlje časa tudi medicina. Povezovanje …
The goal of knowledge discovery in databases is to construct models or discover interesting patterns in data. Model construction and pattern discovery are frequently performed by rule learning, as the induced rules are easy to be interpreted by human experts. The standard classification rule learning task is to induce classification/prediction …