Az új Voice alkalmazás segíthet a súlykontrollban

A fogyás egyik legfontosabb bérlője az összes elfogyasztott kalória számlálása. Míg a feladat könnyen hangzik, az összes kalória dokumentálása nehéz feladattá válik éttermi étkezés közben, útközben nassolva, vagy akár otthon ülve étkezni.

A technika következetességet és pontosságot igényel, és ha nem sikerül, akkor általában azért van, mert az embereknek nincs idejük vagy lehetőségük megtalálni és rögzíteni az összes szükséges információt.

A Massachusettsi Műszaki Intézet (MIT) kutatói most kifejlesztettek egy alkalmazást, amely lehetővé teszi az emberek számára, hogy beszédvezérelt rendszer segítségével jelentkezzenek be az elfogyasztott ételekben és italokban.

A koncepció néhány évvel ezelőtt jelent meg, amikor a Tufts University táplálkozási szakértői csoport megkereste az MIT kutatóit egy beszélt nyelvű alkalmazás ötletével, amely megkönnyíti az étkezés naplózását.

Ezen a héten a sanghaji Nemzetközi Akusztika, Beszéd és Jelfeldolgozás Konferencián az MIT kutatói bemutatják a beszédvezérelt táplálkozás-naplózó rendszer webalapú prototípusát.

Ezzel a felhasználó verbálisan leírja az étkezés tartalmát, a rendszer elemzi a leírást, és automatikusan lekéri a vonatkozó táplálkozási adatokat az Egyesült Államok Mezőgazdasági Minisztériuma (USDA) által fenntartott online adatbázisból.

Az adatok a megfelelő ételek képeivel és legördülő menükkel együtt jelennek meg, amelyek lehetővé teszik a felhasználó számára, hogy finomítsa leírásukat - például pontos ételmennyiséget választva. De ezek a finomítások szóban is elvégezhetők.

Az a felhasználó, aki azzal kezdi, hogy "Reggelire volt egy tál zabpehely, banán és egy pohár narancslé", akkor módosíthatja a következőt: "Féltem egy fél banánt", és a rendszer frissíti a megjelenített adatokat a banánról, miközben a többit változatlanul hagyja.

"Amit [a Tufts táplálkozási szakemberek] tapasztaltak, hogy azok az alkalmazások, amelyek ott voltak, hogy segítsék az embereket az étkezés naplózásában, kissé unalmasak voltak, és ezért az emberek nem tartottak velük lépést" - mondja James Glass, vezető kutató .

"Tehát pontos és könnyen bevihető információkat kerestek."

Az új cikk első szerzője Mandy Korpusik, az MIT villamosmérnöki és informatikai hallgatója. Csatlakozik hozzá Glass, aki szakdolgozat-tanácsadója; végzős hallgató társa, Michael Price; valamint Calvin Huang, a Glass csoport egyetemi kutatója.

A cikkben a kutatók beszédfelismerő rendszerrel végzett kísérletek eredményeiről számolnak be, amelyeket kifejezetten az élelmiszerekkel kapcsolatos terminológia kezelésére fejlesztettek ki.

Azonban munkájuk nem ez volt a fő hangsúly, mivel étkezési naplózási rendszerük online bemutatója a Google ingyenes beszédfelismerő alkalmazását használja.

Kutatásuk két másik problémára koncentrált. Az egyik a szavak funkcionális szerepének azonosítása: A rendszernek fel kell ismernie, hogy ha a felhasználó rögzíti a „tál zabpehely” kifejezést, a zabpehelyre vonatkozó táplálkozási információk relevánsak, de ha a „zabpehely süti” kifejezés nem az.

A másik probléma a felhasználó és az USDA adatbázis bejegyzéseinek egyeztetése. Például az USDA zabpehelyre vonatkozó adatait a „zab” címszó alatt rögzítik; a „zabpehely” szó sehol sem jelenik meg a bejegyzésben.

Az első probléma megoldására a kutatók gépi tanulást használtak.

Az Amazon Mechanical Turk crowdsourcing platformon keresztül olyan munkavállalókat toboroztak, akik egyszerűen leírták, hogy mit ettek a legutóbbi étkezések során. Ezután a leírásban szereplő releváns szavakat élelmiszerek, mennyiségek, márkanevek vagy az élelmiszerek elnevezésének módosítói címkével látták el.

A „tál zabpehelyben” a „tál” mennyiség és a „zabpehely” étel, de a „zabpehelyben” a zabpehely módosító.

Miután nagyjából 10 000 címkézett étkezési leírásuk volt, a kutatók gépi tanulási algoritmusokkal találtak szavak közötti szintaktikai kapcsolatokban olyan mintákat, amelyek azonosítják funkcionális szerepüket.

A kutatók ezt követően a Freebase nevű nyílt forráskódú adatbázist fordították a felhasználók leírása és az USDA adatbázis címkéi között. Maga az adatbázis több mint 8000 általános élelmiszer-tételre vonatkozik, amelyek közül sok szinonimát tartalmaz.

Ahol hiányoztak a szinonimák, ismét beszerveztek Mechanical Turk munkásokat az ellátásukhoz.

A konferencián bemutatott rendszer verziója elsősorban a természetes nyelvű feldolgozás megközelítésének életképességét hivatott bemutatni. A rendszer jelzi a kalóriaszámokat, de még nem összesíti azokat automatikusan.

Van egy változat, amely jelenleg működik, és ha elkészült, a Tufts kutatói felhasználói tanulmány elkészítését tervezik annak megállapítására, hogy valóban megkönnyíti-e a táplálkozási naplózást.

Forrás: MIT