Nagel razvoj strojnega učenja in optimizacije črnih skrinjic je privedel do večje odvisnosti od primerjalnih podatkov za vrednotenje in primerjavo algoritmov na različnih področjih, vendar pa učinkovito izkoriščanje teh podatkov otežujejo izzivi, kot so sintaktična raznolikost, semantična dvoumnost in pomanjkanje standardizacije. Pričujoča disertacija se ukvarja s temi izzivi in zagovarja …
Domena podatkovnega rudarjenja se ukvarja z analizo različnih vrst podatkov. Podatki, ki se običajno uporabljajo v podatkovnem rudarjenju, so po navadi v obliki ene same tabele, kjer vsaka vrstica vsebuje vrednost atributa, t.j., spremenljivke ki so primitivnega podatkovnega tipa. Obstaja vedno več zanimanjaVendar pa za strukturirane (kompleksne) podatke, kot so …