Gradnja značilk, ki vključuje tako ročno zasnovo s strani domenskih strokovnjakov kot tudi avtomatizirano učenje uporabnih predstavitev podatkov, je ključen vidik strojnega učenja. Glavni cilj je pretvoriti surove podatke v obliko, ki jo lahko učinkoviteje izkoristimo s pristopi strojnega učenja. Čeprav je gradnja značilk dobro raziskana na področjih kot sta …
Samodejno luščenje terminologije (SLT) oz. samodejno luščenje terminov je naloga obdelave naravnega jezika (ONJ), ki identificira specializirano terminologijo v domenskih korpusih. SLT se ne uporablja le pri terminografskih nalogah (npr. ustvarjanje specializiranih slovarjev), temveč omogoča tudi izboljšavo več drugih kompleksnih nalog s področja ONJ (npr. strojno prevajanje in luščenje informacij). …
V zadnjem desetletju je hiter napredek na področju obdelave naravnega jezika odprl nove možnosti za reševanje zapletenih vprašanj, kot je analiza pristranskosti novic. Ta napredek je raziskovalcem omogočil raziskovanje inovativnih pristopov za odkrivanje zapletenih pristranskosti, ki so neločljivo povezane s postopki priprave in poročanja o novicah. Pristranskost novic, ki je …
Disertacija obravnava razvoj novih scenarijev odkrivanja znanja v modernem okolju za podatkovno rudarjenje z uporabo principov servisno orientirane arhitekture, spletnih servisov, interaktivnih delotokov, ontologij ter avtomatske gradnje delotokov za podatkovno rudarjenje. Razvili smo orodje Orange4WS, ki nadgrajuje Orange, obstoječe odprtokodno orodje Orange za podatkovno rudarjenje. Orange4WS omogoča enostavno uporabo spletnih …