Gradnja značilk, ki vključuje tako ročno zasnovo s strani domenskih strokovnjakov kot tudi avtomatizirano učenje uporabnih predstavitev podatkov, je ključen vidik strojnega učenja. Glavni cilj je pretvoriti surove podatke v obliko, ki jo lahko učinkoviteje izkoristimo s pristopi strojnega učenja. Čeprav je gradnja značilk dobro raziskana na področjih kot sta …
Samodejno luščenje terminologije (SLT) oz. samodejno luščenje terminov je naloga obdelave naravnega jezika (ONJ), ki identificira specializirano terminologijo v domenskih korpusih. SLT se ne uporablja le pri terminografskih nalogah (npr. ustvarjanje specializiranih slovarjev), temveč omogoča tudi izboljšavo več drugih kompleksnih nalog s področja ONJ (npr. strojno prevajanje in luščenje informacij). …
V zadnjem desetletju je hiter napredek na področju obdelave naravnega jezika odprl nove možnosti za reševanje zapletenih vprašanj, kot je analiza pristranskosti novic. Ta napredek je raziskovalcem omogočil raziskovanje inovativnih pristopov za odkrivanje zapletenih pristranskosti, ki so neločljivo povezane s postopki priprave in poročanja o novicah. Pristranskost novic, ki je …