Ogledi: 9 | Prenosi: 10
Gradnja značilk, ki vključuje tako ročno zasnovo s strani domenskih strokovnjakov kot tudi
avtomatizirano učenje uporabnih predstavitev podatkov, je ključen vidik strojnega učenja.
Glavni cilj je pretvoriti surove podatke v obliko, ki jo lahko učinkoviteje izkoristimo s
pristopi strojnega učenja. Čeprav je gradnja značilk dobro raziskana na področjih kot
sta obdelava naravnega jezika in računalniški vid, je na področju analize časovnih vrst
raziskana v nekoliko manjši meri, medtem ko na področju enokriterijske optimizacije ostaja
večinoma neraziskana.
Področje enokriterijske optimizacije ponuja le peščico pristopov za gradnjo značilk.
Glavni cilj raziskovanja gradnje značilk v tem kontekstu je ustvariti značilke, ki opisujejo
osnovne lastnosti optimizacijske funkcije, kot sta število ekstremov ali zahtevnost njihovega
iskanja. Druga pomembna aplikacija gradnje značilk v optimizaciji je takoimenovana
izbira algoritmov, kjer se lastnosti funkcije uporabljajo za priporočanje najustreznejšega
optimizacijskega algoritma. Medtem ko obstoječi pristopi na tem področju sicer zajamejo
nekatere osnovne lastnosti funkcij, imajo v veliki meri še vedno številne pomanjkljivosti,
zlasti pri izbiri algoritmov. V okviru disertacije sta razviti dve novi metodi gradnje značilk.
Prva metoda uporablja pristope topološke analize podatkov, kjer z vzorci, pridobljenimi
iz optimizacijske funkcije, pokažemo, da je možno zgraditi značilke, ki so invariantne na
rotacije in translacije v prostoru. Drugi pristop gradnje značilk temelji na uporabi naključnih
transformacij, pri čemer so pridobljeni vzorci pretvorjeni v večje število značilk. Oba
pristopa sta ovrednotena na različne načine, kot so razlikovanje med funkcijami, napovedovanje
lastnosti funkcij in izbira algoritmov.
Drugi del te disertacije se osredotoča na tehnike gradnje značilk za podatke časovnih
vrst. Prvi sklop se nanaša na pomen značilk časovnih vrst pri izbiri najustreznejšega napovednega
algoritma. Na tem področju obstaja nekaj raziskovalnih pristopov, ki naslavljajo
izbiro algoritmov, vendar večina teh pristopov zgolj pokaže, da lahko značilke uporabimo za
izbiro algoritmov, vendar brez poglobljene analize, zakaj je bila izbrana posamezna metoda.
V okviru te disertacije pokažemo, da je mogoče zasnovati razložljiv način izbire algoritmov,
ki omogoča transparentne odločitve. Drugi sklop pa se nanaša na vprašanje robustnosti
grajenih predstavitev pri klasifikaciji časovnih vrst. Čeprav je področje klasifikacije časovnih
vrst dobro raziskano, ostajajo odprta vprašanja, kot so vpliv različnih deformacij
na značilke ter kako te vplivajo na delovanje končnih klasifikatorjev. V disertaciji zato
raziskujemo robustnost značilk in ponudimo razlago, zakaj so nekatere predstavitve bolj
odporne na deformacije kot druge.
gradnja značilk časovne vrste strojno učenje klasifikacija časovnih vrst