A Big Data segíthet a számítógépekhez a képekhez kötött azonosító érzelmekben

Az olyan népszerű webhelyek, mint a Twitter, a Facebook és más csatornák, most tele vannak képekkel, amelyek segítenek az embernek jobban kifejezni gondolatait és érzéseit. Új kutatások szerint a „big data” - bármilyen nagy vagy összetett adathalmaz-gyűjtemény, amelyet a hagyományos adatfeldolgozó alkalmazásokkal nehéz feldolgozni - felhasználható a számítógépek megtanítására a képekhez kapcsolódó tartalom és érzések értelmezésére.

Dr. Jiebo Luo, a Rochesteri Egyetem informatikai professzora az Adobe Research kutatóival együttműködve a közelmúltban az Amerikai Mesterséges Intelligencia Szövetsége (AAAI) konferenciáján előadást ismertetett, amely egy progresszív, mély konvolúciós ideghálózatot (CNN) ismertet. .

A betanított számítógép segítségével ezután meghatározható, hogy milyen érzelmeket váltanak ki ezek a képek. Luo szerint ezek az információk hasznosak lehetnek olyan változatos dolgokban, mint a gazdasági mutatók mérése vagy a választások előrejelzése.

A feladat azonban összetett. A szöveg hangulatú elemzése számítógéppel maga is kihívást jelentő feladat. A közösségi médiában pedig az érzelmek elemzése bonyolultabb, mert sokan képek és videók segítségével fejezik ki magukat, amelyeket a számítógép számára nehezebb megérteni.

Például egy politikai kampány során a választók gyakran képeken keresztül osztják meg véleményüket.

Két különböző kép ugyanazt a jelöltet láthatja, de lehet, hogy nagyon eltérő politikai nyilatkozatokat tesznek. Az ember felismerheti, hogy az egyik a jelölt pozitív portréja (pl. A jelölt mosolyog és felemeli a karját), a másik pedig negatív (például egy kép, amelyen a jelölt legyőzöttnek látszik).

De egyetlen ember sem nézhette meg a közösségi médiában megosztott összes képet - ez valóban „nagy adat”. Ahhoz, hogy megalapozott találgatásokat tehessen a jelölt népszerűségéről, a számítógépeket ki kell képezni arra, hogy ezeket az adatokat megemésztsék, amit Luo és munkatársai megközelítése pontosabban képes megtenni, mint amennyire ez eddig lehetséges volt.

A kutatók képminősítési problémaként kezelik a képek érzelmek kinyerésének feladatát. Ez azt jelenti, hogy valahogy mindegyik képet elemezni kell, és címkéket kell rá rakni.

A képzési folyamat megkezdéséhez Luo és munkatársai rengeteg Flickr-képet használtak fel, amelyeket egy gépi algoritmus lazán felcímkézett specifikus érzelmekkel, egy meglévő SentiBank néven ismert adatbázisban (Dr. Shih-Fu Chang kolumbiai csoportja fejlesztette ki). Egyetemi).

Ez megadja a számítógépnek a kiindulópontot annak megértéséhez, hogy egyes képek mit képesek közvetíteni.

De a gép által generált címkék tartalmazzák annak valószínűségét is, hogy az adott címke igaz legyen, vagyis mennyire biztos a számítógép abban, hogy a címke helyes?

A képzési folyamat kulcsfontosságú lépése következik, amikor eldobnak minden képet, amelyre az érzés vagy az érzés, amelyre felcímkézték, nem biztos, hogy igaz. Tehát csak a „jobb” címkével ellátott képeket használják továbbképzéshez, fokozatosan javuló módon az erőteljes konvolúciós ideghálózat keretein belül.

Resaercher megállapította, hogy ez az extra lépés jelentősen javította az egyes képek címkézésének pontosságát.

Ezt a hangulatelemző motort is adaptálták a Twitterből kivont néhány képpel. Ebben az esetben „tömegintelligenciát” alkalmaztak, többen pedig az Amazon Mechanical Turk platformon keresztül segítették a képek kategorizálását.

Csak kis számú képet használtak a számítógép finomhangolásához, és ennek a tartomány-adaptációs folyamatnak az alkalmazásával megmutatták, hogy javítani tudják a Twitter-képek hangulat-elemzésének korszerű módszereit.

Az egyik meglepő megállapítás az, hogy a képi hangulatosztályozás pontossága meghaladta az ugyanazon Twitter-üzenetek szövegérzékelésének pontosságát.

Forrás: Rochesteri Egyetem

!-- GDPR -->