PREDMETI

Podatkovno in tekstovno rudarjenje

20

ECTS Kreditne točke

Predavatelji
  • prof. dr. Dunja Mladenić
Smeri
  • IKT2

Cilji

Odkrivanje zakonitosti v podatkih je proces odkrivanja vzorcev in modelov, opisanih s pravili ali drugimi človeku razumljivimi formalizmi za predstavitev znanja. Najpomembnejši del tega procesa predstavlja podatkovno rudarjenje, ki vključuje uporabo metod, tehnik in orodij za avtomatsko odkrivanje vzorcev in konstrukcijo modelov iz podatkov. Cilji predmeta so: - predstaviti osnove podatkovnega rudarjenja, postopke odkrivanja zakonitosti v podatkih, metodologijo CRISP-DM ter osnove upravljanja znanja, - predstaviti standardne oblike zapisa različnih vrst podatkov, usposobiti študente za manipulacijo tabelaričnih podatkov, podatkovnih baz in skladišč ter tekstovnih, spletnih in večpredstavnih podatkov, - predstaviti izbrane metode in tehnike rudarjenja tabelaričnih podatkov, - predstaviti izbrane metode in tehnike rudarjenja tekstovnih, spletnih in večpredstavnih podatkov, - usposobiti študente za praktično uporabo izbranih orodij podatkovnega rudarjenja in metod za evalvacijo rezultatov.

Predmetnik

Uvod: uvod v podatkovno rudarjenje in odkrivanje zakonitosti v podatkih, povezava s strojnim učenjem, vizualizacija podatkov, vzorcev in modelov, predstavitev CRISP-DM metodologije odkrivanja zakonitosti v podatkih ter osnove upravljanja znanja. Predstavitev in manipulacija podatkov: predstavitev standardnih oblik zapisa različnih vrst podatkov ter kreiranje in manipulacija tabelaričnih podatkov, podatkovnih baz in skladišč ter obravnava tekstovnih, spletnih in večpredstavnih podatkov. Tehnike rudarjenja tabelaričnih podatkov: predstavitev posameznih tehnik rudarjenja podatkov: predstavitev preiskovalnih hevristik in metod za učenje odločitvenih dreves, učenje klasifikacijskih in povezovalnih pravil, razvrščanje v skupine, odkrivanje podskupin, učenje regresijskih dreves in relacijsko podatkovno rudarjenje. Tehnike rudarjenja tekstovnih, spletnih in večpredstavnih podatkov: predstavitev posameznih tehnik za analizo tekstovnih, spletnih in večpredstavnih podatkov ter metod vizualizacije podatkov. Ocenjevanje: predstavitev metod za ocenjevanje kvalitete naučenih vzorcev in modelov ter metodologija evalvacije rezultatov. Praktično usposabljanje: praktična uporaba izbranih orodij za manipulacijo in rudarjenja podatkov.

Obveznosti

Zaključen študijski program prve stopnje s področja naravoslovja, tehnike ali računalništva.

Preverjanje znanja

Literatura in reference

Več
Skrij