V disertaciji obravnavamo problem učenja različnih vrst odločitvenih dreves na podlagi podatkovnih tokov, ki se spreminjajo v času. Posebej se posvetimo študiju sprotnih (online) algoritmov strojnega učenja za učenje regresijskih dreves, linearnih modelnih dreves, opcijskih dreves za regresijo, več-kriterijskih modelnih dreves in ansamblov modelnih dreves na podlagi podatkov iz časovnih …
Domena podatkovnega rudarjenja se ukvarja z analizo različnih vrst podatkov. Podatki, ki se običajno uporabljajo v podatkovnem rudarjenju, so po navadi v obliki ene same tabele, kjer vsaka vrstica vsebuje vrednost atributa, t.j., spremenljivke ki so primitivnega podatkovnega tipa. Obstaja vedno več zanimanjaVendar pa za strukturirane (kompleksne) podatke, kot so …
Urejanje značilk (ang. feature ranking) je naloga strojnega učenja pri kateri želimo značilke iz dane množice podatkov urediti glede na neko mero pomembnosti. V disertaciji obravnavamo urejanje značilk v okviru nadzorovanega učenja, zato je pojem pomembnosti značilk opredeljen glede na ciljni koncept. Urejanje značilk je le redko obravnavano kot samostojna …
Ali je mogoče zaupati modelu, zgrajenem z algoritmi strojnega učenja in rudarjenja podatkov? Znano je, da lahko model v obliki odločitvenega drevesa vsebuje slabe, tj. manj verodostojne dele, ki jih povzročajo patološko obnašanje indukcijskih algoritmov, šum in manjkajoče vrednosti v podatkih, lahko pa se pojavijo tudi zaradi kompleksnosti domene. Takšni …
Disertacija obravnava formalizacijo in implementacijo procesa za polavtomatsko gradnjo ontologij. Predlagamo teoretični okvir za formalizacijo procesa polavtomatske gradnje ontologij. Proces je predstavljen kot zaporedje operatorjev, uporabljenih na ontologijo. Identificirani so pogosti tipi operatorjev, pri čemer je vsak od njih operator posplošen do mere, potrebne za odkritje operatorja s kombinacijo metod …
Solving real-life optimization problems numerically is often very time demanding, because of high complexity of the simulations that are usually involved. Solving such problems becomes highly impractical for this reason and can even lead to use of less complex and also less accurate models. Fortunately, evolutionary algorithms, often used in …
Danes smo priča zelo hitremu razvoju telekomunikacijskih omrežij in storitev. Še posebej je v zadnjih letih zelo napredoval razvoj brezžičnih omrežij. Tako se lahko na različnih tržiščih srečamo z različnimi tehnologijami, ki omogočajo brezžično komuniciranje. Med brezžičnimi omrežji so v zadnjih desetih letih še posebej hitro napredovala mobilna omrežja. Prvi …
The goal of knowledge discovery in databases is to construct models or discover interesting patterns in data. Model construction and pattern discovery are frequently performed by rule learning, as the induced rules are easy to be interpreted by human experts. The standard classification rule learning task is to induce classification/prediction …
Skladenjsko razčlenjevanje na področju jezikovnih tehnologij predstavlja enega od vmesnih korakov analize besedila v aplikacijah, kot so strojno prevajanje, luščenje informacij, odgovarjanje na vprašanja itd. Za opis strukture povedi se pogosto uporablja skladenjska drevesa. Posebna vrsta skladenjskega razčenjevanja je odvisnostno razčlenjevanje. Razčlenjevalniki iz besedila zgradijo drevesa. Pri podatkovno orientiranem razčlenjevanju …
Developing metaheuristics to solve optimization problems is a rapidly growing field of research. This is due to the importance of optimization problems in the scientific as well as the industrial world. The methods developed in this dissertation are based on stigmergy: a method of communication in emergent systems, where the …