MPŠ
MPŠ MP&Scaron MP&Scaron MP&Scaron Avtorji

Mednarodna
podiplomska šola
Jožefa Stefana

Jamova 39
SI-1000 Ljubljana
Slovenija

Tel: (01) 477 31 00
Faks: (01) 477 31 10
E-pošta: info@mps.si

Išči

Opis predmeta

Analiza tekstovnih in večpredstavnih podatkov ter semantične tehnologije

Programi:

Informacijske in komunikacijske tehnologije, 3. stopnja

Sodelavci:

prof. dr. Dunja Mladenić

Cilji:

Cilj predmeta je usposobiti študente za raziskovalno in razvojno delo na področju analize tekstovnih in večpredstavnih podatkov ter semantičnih tehnologij.
Kompetence študenta z uspešno zaključenim predmetom bodo vključevale razumevanje metod in tehnike analize tekstovnih in večpredstavnih podatkov ter semantičnih tehnologij in sposobnost za uporabo ustreznih orodij. Študent bo tudi pridobil znanja potrebna za samostojno raziskovalno delo in razvoj.

Vsebina:

Osnove dela s tekstovnimi in drugimi večpredstavnimi podatki:
iskanje zakonitosit v podatkih
osnovno procesiranje podatkov
statistična dejstva in evidenca

Predstavitev podatkov:
leksikalna, sintaktična semantična

Poglobljeni vpogled v izbrane scenarije zahtevnejše uporabe osnovnih metod:
ekstrakcija znanja iz podaktov
modeliranje uporabnikov
analiza komunikacije v omrežjih
večjezični in prekojezični podatki

Tehnike:
nadzorovano učenje
pol-nadzorovano učenje
ne nadzorovano učenje

Izzivi analize velikih količin podatkov:
netipične operacije nad podatki
shranjevanje velikih količin podatkov

Temeljna literatura in viri:

Izbrana poglavja iz naslednjih virov:

• C. Sammut, and G. I. Webb, Eds. Encyclopedia of Machine Learning, Springer 2010. ISBN 0387307680 (selected entries)
• D. Mladenić, N. Lavrač, M. Bohanec, and S. Moyle, Eds. Data Mining and Decision Support: Integration and Collaboration. Kluwer 2003. ISBN 1402073887 (selected chapters)
• J.Davies, M. Grobelnik, and D. Mladenić, Eds. Semantic Web: Integrating Ontology Management, Knowledge Discovery and Human Language Technologies, Springer, 2008. ISBN 3642100287 (selected chapters)
• P. Warren, J. Davies, and E. Simperl, Eds. Context and Semantics for Knowledge Management: Technologies for Personal Productivity. Heidelberg: Springer, cop. 2011. ISBN 3642195091 (selected chapters)

Izbrane reference nosilca:

• D. Mladenić, and M. Grobelnik, Machine learning on text. In: GOLUB, Koraljka, Ed. Subject access to information : an interdisciplinary approach. Santa Barbara; Denver; Oxford: Libraries Unlimited, 2015, pp. 132-148.
• D. Mladenić, and M. Grobelnik, Automatic text analysis by artificial intelligence. Informatica, ISSN 0350-5596, 2013, 37:1, pp. 27-33.
• D. Mladenić, J. Brank, and M. Grobelnik, Document classification. In: Sammut, C. and Webb, G.I. (eds.). Encyclopedia of Machine Learning. New York: Springer, 2011, pp. 289-293.
• D. Mladenić, Text mining. In: Sammut, C. and Webb, G.I. (eds.). Encyclopedia of Machine Learning. New York: Springer, 2011, pp. 962-963.
• D. Mladenić, Feature selection in text mining. In: Sammut, C. and Webb, G.I. (eds.). Encyclopedia of Machine Learning. New York: Springer, 2011, pp. 406-410.
• L. Bradeško, and D. Mladenić, A survey of chabot system through a Loebner prize competition. In: Erjavec, T. and Žganec Gros, J. (eds.) Proceedings of the Eighth Language Technologies Conference : proceedings of the 15th International Multiconference Information Society - IS 2012, volume C, Ljubljana: Institut Jožef Stefan, 2012, pp. 34-37.

Načini preverjanja znanja:

Ustni izpit (50%)
Seminarska naloga z ustnim zagovorom (50%)

Obveznosti študentov:

Ustni izpit
Seminarska naloga z ustnim zagovorom

Zunanje povezave: