Ogledi: 7 | Prenosi: 9
Tako kot ljudje tudi roboti, ki naj bi opravljali posamezne naloge namesto človeka, potrebujejo
ustrezne veščine za te naloge. V nestrukturiranem okolju in za zapletene naloge je
zaradi zapletenosti te veščine težko sprogramirati vnaprej. Bolje je, da robotom omogočimo,
da se sami naučijo potrebnih spretnosti.
Dinamični generatorji gibov (DGG) so se izkazali kot učinkovita predstavitev gibanja
pri učenju gibalnih spretnosti. V tej disertaciji predlagamo nov pristop k učenju globokih
nevronskih mrež za računanje DGG. Poglavitna novost našega pristopa je, da uporabljamo
novo optimizacijsko funkcijo, ki meri fizično razdaljo med trajektorijami gibanja in ne le
napako med parametri DGG, ki nimajo fizičnega pomena. Ta pristop smo omogočili z
izpeljavo diferencialnih enačb za izračun gradientov predlagane optimizacijske funkcije,
kar omogoča uporabo metode vzvratnega razširjanja napake za optimizacijo parametrov
globokih nevronskih mrež.
Pri rekonstrukciji gibanja je pomembna izbira ustrezne oblike predstavitve gibanja.
Različica DGG, imenovana dinamični elementarni gibi po naravnem parametru (NP-DGG),
lahko loči prostorski in časovni vidik gibanja in je primernejša za obdelavo podatkov brez
informacije o časovnem poteku. Zato smo predlagano metodologijo razširili iz DGG na
nevronske mreže, ki sintetizirajo gibalne poti, predstavljene z NP-DGG.
Razviti pristopi so sicer uporabni za katero koli arhitekturo nevronske mreže, vendar
smo jih v disertaciji preizkusili na dveh različnih arhitekturah, ki temeljita na kodirnodekodirnih
mrežah in konvolucijskih nevronskih mrežah. Predlagali smo tudi dodatne
arhitekture globokih nevronskih mrež, ki podpirajo obdelavo slik spremenljive velikosti
in slik z nestrukturiranim ozadjem. Razviti pristopi so bili uporabljeni za reprodukcijo
ročno napisanih števk iz digitalnih slik. Naši rezultati kažejo, da uporaba predlaganih
optimizacijskih funkcij daje boljše rezultate kot uporaba običajnih optimizacijskih funkcij,
ki merijo napako med parametri. Iz naših rezultatov je tudi razvidno, da predlagana
nevronska mreža omogoča uporabo vhodnih slik drugačne velikosti kot slike v podatkovni
zbirki za učenje. Predlagane pristope smo na koncu uspešno uporabili za reprodukcijo
realnih rokopisnih števk s humanoidnim robotom.
Tako kot ljudje lahko tudi roboti izboljšajo svoje sposobnosti z vadbo (učenjem), to je
z večkratno izvedbo želene naloge in posodobitvijo parametrov z uporabo na novo zbranih
podatkov. V tej disertaciji predlagamo učenje robotov z uporabo statističnega in spodbujevalnega
učenja v latentnem prostoru želene naloge. Latentni prostor izračuna globoka
nevronska mreža za avtokodiranje, pri čemer podatke za učenje mreže ustvarimo v simulaciji.
Z eksperimenti smo pokazali, da je tako generirana latentna predstavitev uporabna
tudi za učenje na realnem robotu.
Rezultati simulacij in eksperimentov z realnim robotom kažejo, da je mogoče z uporabo
latentnega prostora gibalnih veščin doseči znatno zmanjšanje količine podatkov, potrebnih
za učinkovito učenje z Gaussovo regresijo. Podobno lahko znatno zmanjšamo število
epizod spodbujevalnega učenja. Prav tako je latentni prostor, ki temelji na avtokoderju,
učinkovitejši kot latentni prostor, izračunan z metodo glavnih komponent.
robotika nevronske mreže statistično učenje spodbujevalno učenje latentni prostor gibalne veščine učenje z Gaussovo regresijo