Repozitorij > Rezultati

Doktorska disertacija

Zaznavanje in razpoznavanje slik hrane in pijače z uporabo globokih konvolucijskih nevronskih mrež

Avtor(ji): Simon Mezgec (Avtor), Barbara Koroušić Seljak (Mentor)

Datum zagovora: 03.12.2021

Organizacija: MPŠ - Mednarodna podiplomska šola Jožefa Stefana

PID: 20.500.12556/ReVIS-13908

Prenesi glavno datoteko (22,1 MB)

Ogledi: 4 | Prenosi: 9

Povzetek

Zdrava prehrana postaja čedalje pomembnejša, saj spoznanja glede pomanjkljivosti v prehrani
pogosto vodijo do zaključkov, s pomočjo katerih lahko posameznik izboljša svoje
zdravstveno stanje. Za prepoznavanje mogočih področij za izboljšave pa je potrebno beležiti
vnos hrane. Tradicionalno so bile za to uporabljene ročne metode, vendar so zanje
značilne številne pomanjkljivosti, kot sta nenatančnost ter visok nivo zahtevanega truda in
motivacije za ročno beleženje vnosa hrane. Zaradi tega so za bolj učinkovito beleženje potrebne
nove rešitve, ki lahko avtomatizirajo ta postopek in s tem poenostavijo ocenjevanje
prehrane. Zaradi vseprisotnosti pametnih mobilnih telefonov z vgrajenimi fotoaparati je
avtomatizacija ocenjevanja prehrane s pomočjo razpoznavanja slik hrane in pijače, ki niso
nujno najboljše kakovosti, obetaven pristop za razvoj rešitev, ki lahko dosežejo visok delež
prebivalstva. Za reševanje tega problema je bilo predstavljenih več pristopov, najboljše
rezultate pa so dosegle rešitve, ki uporabljajo globoko učenje oziroma natančneje—globoke
nevronske mreže.
V tej doktorski disertaciji so predstavljene tri rešitve za zaznavanje, razpoznavanje in
segmentacijo slik hrane in pijače z uporabo globokih konvolucijskih nevronskih mrež. Te
so vrsta globokih nevronskih mrež, ki se večinoma uporabljajo za obdelovanje slik. Prva
rešitev vključuje model za zaznavanje slik, ki ne vsebujejo hrane, v samostojno pridobljeni
podatkovni zbirki slik ter model za razpoznavanje, ki temelji na novi arhitekturi globokih
nevronskih mrež, imenovani NutriNet. S to arhitekturo je bila dosežena 86,72 % klasifikacijska
točnost. Druga rešitev temelji na lažni hrani (replike hrane), ki se uporablja v
eksperimentalnih raziskavah prehranjevalnega vedenja. Z uporabo obstoječe arhitekture
globokih nevronskih mrež je bil naučen model za segmentacijo na podatkovni zbirki slik
lažne hrane, ki je dosegel 92,18 % točnost. Tretja rešitev temelji na drugi rešitvi in oddana
je bila v sklopu svetovnega tekmovanja v razpoznavanju slik hrane Food Recognition
Challenge. V okviru tekmovanja je bil naučen model za segmentacijo, ki je dosegel 59,2 %
natančnost na zahtevni podatkovni zbirki tekmovanja, ki vsebuje slike hrane in pijače iz
resničnega sveta, s čimer je ta rešitev dosegla drugo mesto v drugi rundi tekmovanja.
Predstavljene rešitve in rezultati so v preteklih letih prispevali k razvoju področja
razpoznavanja slik hrane in dodatno potrjujejo smiselnost uporabe globokih konvolucijskih
nevronskih mrež za reševanje tega problema. Na področju globokega učenja je prispevek
predstavljenih rešitev nova arhitektura ter pristop k zbiranju vhodnih podatkov. Kolikor je
avtorju znano, so bile te rešitve tudi v več pogledih prve: rešitev, ki temelji na arhitekturi
NutriNet, je bila prva, ki je razpoznavala slike pijač, medtem ko je bila rešitev, ki temelji na
lažni hrani, prva, ki je samodejno razpoznavala replike hrane, in tudi prva, ki je vsebovala
enotno arhitekturo globokih konvolucijskih nevronskih mrež za skupno segmentacijo in
klasifikacijo slik hrane.

Metapodatki

Vrsta dela	Doktorska disertacija
Jezik	Angleški
Organizacija	MPŠ - Mednarodna podiplomska šola Jožefa Stefana
PID	20.500.12556/ReVIS-13908
COBISS ID	97810435
UDK	004.932.72:641(043.3)
Datum zagovora	03.12.2021

Ključne besede

razpoznavanje vzorcev globoke konvolucijske nevronske mreže globoko učenje razpoznavanje slik razpoznavanje hrane razpoznavanje pijače nevronske mreže umetna inteligenca

Priloge

Priloga - academic_work_attachments/Simon_Mezgec_… (22,1 MB) MD5: 1a83050058e5802a66b5f134a8669ed6

Citiraj to delo

Slog citiranja:

Nazaj na iskanje Poglej v ReVIS Poglej v COBISS