REPOZITORIJ > REZULTATI

Doktorska disertacija

Predstavitev in uporaba podatkov iz primerjalnih študij za optimizacijo in učenje

Avtor(ji): Ana Kostovska (Avtor), Panče Panov (Mentor), Sašo Džeroski (Somentor), Tome Eftimov (Somentor)

Datum zagovora: 14.03.2025

Organizacija: MPŠ - Mednarodna podiplomska šola Jožefa Stefana

PID: 20.500.12556/ReVIS-13663

Ogledi: 8 | Prenosi: 13

Povzetek

Nagel razvoj strojnega učenja in optimizacije črnih skrinjic je privedel do večje odvisnosti
od primerjalnih podatkov za vrednotenje in primerjavo algoritmov na različnih področjih,
vendar pa učinkovito izkoriščanje teh podatkov otežujejo izzivi, kot so sintaktična raznolikost,
semantična dvoumnost in pomanjkanje standardizacije. Pričujoča disertacija se
ukvarja s temi izzivi in zagovarja formalno semantično predstavitev primerjalnih podatkov
z uporabo ontologij. Uporaba ontologij izboljšuje deljenje znanja in spodbuja interoperabilnost
podatkov med raziskavami v strojnem učenju in optimizaciji črnih skrinjic.
Na področju strojnega učenja, s poudarkom na nalogi večoznačne klasifikacije, razvijamo
okvir, ki temelji na ontologijah za semantično označevanje primerjalnih podatkov, kar
omogoča oblikovanje MLCBench, semantičnega kataloga za izboljšanje dostopnosti in uporabnosti
podatkov. Na področju optimizacije črnih skrinjic uvajamo ontologijo OPTION
(OPTImization algorithm benchmarking ONtology), ki formalno predstavlja primerjalne
podatke, vključno s podatki o uspešnosti, metapodatki algoritmov in značilnostih problemov.
Tovrstna ontologija omogoča integracijo ter interoperabilnost znanja in podatkov iz
različnih študij. Na podlagi semantično označenih primerjalnih podatkov izvajamo različne
empirične študije, vključno z nalogami, kot sta napovedovanje uspešnosti algoritmov
in samodejna izbira algoritmov.
Na področju večoznačne klasifikacije predlagamo delotok samodejne izbire algoritmov,
ki uporablja te primerjalne podatke, temelječe na večoznačni klasifikaciji. Ocenjujemo
napovedno moč metaznačilk iz podatkovnih množic za nalogo samodejne izbire algoritmov
ter raziskujemo različne pristope strojnega učenja – vključno z regresijo, klasifikacijo in
metodami parnega ujemanja –, da bi identificirali najučinkovitejši pristop.
Na področju optimizacije črnih skrinjic izkoriščamo primerjalne podatke modularnih
algoritmov za celovito analizo, kako posamezni moduli algoritmov vplivajo na skupno uspešnost.
Razvijamo metapredstavitve, ki temeljijo na vrednostih uspešnosti in pomenu značilnostmi,
s čimer učinkovito povezujemo obnašanje algoritmov z značilnostmi problemov.
Z uporabo teh metapredstavitev prav tako napovedujemo konfiguracije modulov, kar omogoča
globlji vpogled v vpliv posameznih modulov na uspešnost algoritmov.
Poleg tega uporabljamo semantično označene primerjalne podatke modularnih algoritmov,
in sicer kot osnovo za ustvarjanje različnih grafov znanja, ki jih nato uporabljamo
za preučevanje njihove napovedne moči za napovedovanje uspešnosti algoritmov. S pristopoma
vstavitve grafov znanja na osnovi točkovanja in grafovskih nevronskih mrež napovedujemo
uspešnost algoritmov v transduktivnih in induktivnih scenarijih.
Prispevki pričujoče disertacije vključujejo razvoj ontoloških okvirov za upravljanje primerjalnih
podatkov na področjih strojnega učenja in optimizacije črnih skrinjic, ustvarjanje
semantičnih podatkovnih katalogov ter nove metodologije za izbiro in napovedovanje uspešnosti
algoritmov. Z obravnavo vidikov predstavljanja in uporabe podatkov iz primerjalnih
študij disertacija izpopolnjuje področji strojnega učenja in optimizacije črnih skrinjic ter
zagotavlja orodja, ki omogočajo boljše upravljanje podatkov, izboljšano izbiro algoritmov
in globlje razumevanje njihovega delovanja.

Priloge

Citiraj to delo