Gradnja značilk, ki vključuje tako ročno zasnovo s strani domenskih strokovnjakov kot tudi avtomatizirano učenje uporabnih predstavitev podatkov, je ključen vidik strojnega učenja. Glavni cilj je pretvoriti surove podatke v obliko, ki jo lahko učinkoviteje izkoristimo s pristopi strojnega učenja. Čeprav je gradnja značilk dobro raziskana na področjih kot sta …
Doktorska disertacija preučuje ekološko dinamiko fitoplanktonskih združb v severnem Jadranu s poudarkom na fenologiji, okoljskih dejavnikih in trofodinamiki. Kompleksnost območja, ki ga zaznamujejo pestrost fitoplanktonskih združb, velika spremenljivost okolja in intenzivne človekove dejavnosti v tej disertaciji ni obravnavana kot ovira, temveč kot priložnost za pridobitev novih ekoloških spoznanj. Disertacija gradi …
Nagel razvoj strojnega učenja in optimizacije črnih skrinjic je privedel do večje odvisnosti od primerjalnih podatkov za vrednotenje in primerjavo algoritmov na različnih področjih, vendar pa učinkovito izkoriščanje teh podatkov otežujejo izzivi, kot so sintaktična raznolikost, semantična dvoumnost in pomanjkanje standardizacije. Pričujoča disertacija se ukvarja s temi izzivi in zagovarja …
Samodejno luščenje terminologije (SLT) oz. samodejno luščenje terminov je naloga obdelave naravnega jezika (ONJ), ki identificira specializirano terminologijo v domenskih korpusih. SLT se ne uporablja le pri terminografskih nalogah (npr. ustvarjanje specializiranih slovarjev), temveč omogoča tudi izboljšavo več drugih kompleksnih nalog s področja ONJ (npr. strojno prevajanje in luščenje informacij). …
Onesnažila, ki vzbujajo nastajajočo zaskrbljenost (CEC), so tipične organske spojine naravnega ali sintetičnega izvora ter produkti njihove razgradnje in pretvorbe (TP) s potencialno škodljivimi učinki na človeka, bioto in okolje. Te spojine so izjemno pomemben del eko-ekspozoma (EE). Njihova identifikacija in kvantifikacija ter raziskovanje njihovega okoljskega obnašanja bistveno večajo naše …
Obujeno področje globokega učenja je v zadnjem desetletju ponudilo pristope, ki postajajo ključni sestavni deli sodobnih inteligentnih sistemov. Poleg učinkovitosti je za te metode značilna tudi njihova sposobnost procesiranja večjih količin podatkov (skaliranje). Glavni pomanjkljivosti globokega učenja sta neinterpretabilnost ter nezmožnost direktne izrabe uporabnega simbolnega predznanja. Veja strojnega učenja, ki …
Večina metod za podatkovno rudarjenje, strojno učenje in statistično analizo podatkov temelji na predpostavki, da so podatki neodvisni in enako porazdeljeni (ang. independent and identically distributed – i.i.d.). To pomeni, da morajo biti učni primeri med seboj neodvisni ter imeti enako verjetnostno porazdelitev. Vendar so primeri, ko podatki niso i.i.d., …
Disertacija obravnava formalizacijo in implementacijo procesa za polavtomatsko gradnjo ontologij. Predlagamo teoretični okvir za formalizacijo procesa polavtomatske gradnje ontologij. Proces je predstavljen kot zaporedje operatorjev, uporabljenih na ontologijo. Identificirani so pogosti tipi operatorjev, pri čemer je vsak od njih operator posplošen do mere, potrebne za odkritje operatorja s kombinacijo metod …
Disertacija obravnava nalogo učenja modelov za napovedovanje strukturiranih vrednosti, ki kot vhod vzamejo vektor vrednosti značilk in na izhodu podajo napoved strukturirane vrednosti. Za razliko od klasifikacije in regresije, kjer je na izhodu ena sama skalarna vrednost, je v našem primeru izhod, oziroma napoved, podatkovna struktura kot na primer vektor …