Ogledi: 11 | Prenosi: 9
Disertacija obravnava formalizacijo in implementacijo procesa za polavtomatsko gradnjo ontologij.
Predlagamo teoretični okvir za formalizacijo procesa polavtomatske gradnje ontologij. Proces je predstavljen kot zaporedje operatorjev, uporabljenih na ontologijo. Identificirani so pogosti tipi operatorjev, pri čemer je vsak od njih operator posplošen do mere, potrebne za odkritje operatorja s kombinacijo metod strojnega učenja ter interakcije z uporabnikom. Predlagan teoretski okvir za učenje ontologij je dovolj splošen, da lahko obdela vrsto domen. Edini predpogoj je obstoj domenskih podatkov v obliki, primerni za metode strojnega učenja.
Operatorji, ki so identificirani kot glavni gradniki procesa gradnje ontologije, so implementirani z uporabo naslednjih metod strojnega učenja. Algoritmi za razvrščanje v skupine (ang. Clustering), vodeno učenje (ang. Active Learning) in klasifikacija so uporabljeni za učenje operaterjev za gradnjo konceptov in relacij. Predstavljene so nove metode za vizualizacijo instanc, konceptov in ontologij, ki temeljijo na kombinaciji metod za zmanjševanje dimenzij (ang. Dimensionality reduction). Možnost vključevanja dodatnih domenskih podatkov je omogočena preko nove metode za uteževanje značilk. Dodajanje novih instanc v razvito ontologijo je prevedeno na večrazredni klasifikacijski problem.
Del disertacije je tudi sistem, ki implementira predlagani teoretični okvir, skupaj s predlaganimi metodami strojnega učenja. Sistem na podlagi domenskih podatkov in metod strojnega učenja vodi uporabnika skozi proces gradnje ontologije za dano domeno. Delovanje sistema je prikazano na več praktičnih primerih, kjer so bili domenski podatki podani v obliki korpusa dokumentov oziroma socialnega omrežja.
Razviti sistem je bil ovrednoten v dveh uporabniških študijah. Njun namen je bil ovrednotiti uporabniški vmesnik in primerjati ontologije, zgrajene v okviru razvitega sistema, z ročno grajenimi ontologijami. Rezultati uporabniških študij kažejo, da je razviti sistem primeren za uporabo s strani domenskih strokovnjakov. Razvite ontologije so primerljive z ročno grajenimi, pri čemer je čas gradnje pomembno krajši.