A Big Data segíthet a számítógépekhez a képekhez kötött azonosító érzelmekben
Az olyan népszerű webhelyek, mint a Twitter, a Facebook és más csatornák, most tele vannak képekkel, amelyek segítenek az embernek jobban kifejezni gondolatait és érzéseit. Új kutatások szerint a „big data” - bármilyen nagy vagy összetett adathalmaz-gyűjtemény, amelyet a hagyományos adatfeldolgozó alkalmazásokkal nehéz feldolgozni - felhasználható a számítógépek megtanítására a képekhez kapcsolódó tartalom és érzések értelmezésére.
Dr. Jiebo Luo, a Rochesteri Egyetem informatikai professzora az Adobe Research kutatóival együttműködve a közelmúltban az Amerikai Mesterséges Intelligencia Szövetsége (AAAI) konferenciáján előadást ismertetett, amely egy progresszív, mély konvolúciós ideghálózatot (CNN) ismertet. .
A betanított számítógép segítségével ezután meghatározható, hogy milyen érzelmeket váltanak ki ezek a képek. Luo szerint ezek az információk hasznosak lehetnek olyan változatos dolgokban, mint a gazdasági mutatók mérése vagy a választások előrejelzése.
A feladat azonban összetett. A szöveg hangulatú elemzése számítógéppel maga is kihívást jelentő feladat. A közösségi médiában pedig az érzelmek elemzése bonyolultabb, mert sokan képek és videók segítségével fejezik ki magukat, amelyeket a számítógép számára nehezebb megérteni.
Például egy politikai kampány során a választók gyakran képeken keresztül osztják meg véleményüket.
Két különböző kép ugyanazt a jelöltet láthatja, de lehet, hogy nagyon eltérő politikai nyilatkozatokat tesznek. Az ember felismerheti, hogy az egyik a jelölt pozitív portréja (pl. A jelölt mosolyog és felemeli a karját), a másik pedig negatív (például egy kép, amelyen a jelölt legyőzöttnek látszik).
De egyetlen ember sem nézhette meg a közösségi médiában megosztott összes képet - ez valóban „nagy adat”. Ahhoz, hogy megalapozott találgatásokat tehessen a jelölt népszerűségéről, a számítógépeket ki kell képezni arra, hogy ezeket az adatokat megemésztsék, amit Luo és munkatársai megközelítése pontosabban képes megtenni, mint amennyire ez eddig lehetséges volt.
A kutatók képminősítési problémaként kezelik a képek érzelmek kinyerésének feladatát. Ez azt jelenti, hogy valahogy mindegyik képet elemezni kell, és címkéket kell rá rakni.
A képzési folyamat megkezdéséhez Luo és munkatársai rengeteg Flickr-képet használtak fel, amelyeket egy gépi algoritmus lazán felcímkézett specifikus érzelmekkel, egy meglévő SentiBank néven ismert adatbázisban (Dr. Shih-Fu Chang kolumbiai csoportja fejlesztette ki). Egyetemi).
Ez megadja a számítógépnek a kiindulópontot annak megértéséhez, hogy egyes képek mit képesek közvetíteni.
De a gép által generált címkék tartalmazzák annak valószínűségét is, hogy az adott címke igaz legyen, vagyis mennyire biztos a számítógép abban, hogy a címke helyes?
A képzési folyamat kulcsfontosságú lépése következik, amikor eldobnak minden képet, amelyre az érzés vagy az érzés, amelyre felcímkézték, nem biztos, hogy igaz. Tehát csak a „jobb” címkével ellátott képeket használják továbbképzéshez, fokozatosan javuló módon az erőteljes konvolúciós ideghálózat keretein belül.
Resaercher megállapította, hogy ez az extra lépés jelentősen javította az egyes képek címkézésének pontosságát.
Ezt a hangulatelemző motort is adaptálták a Twitterből kivont néhány képpel. Ebben az esetben „tömegintelligenciát” alkalmaztak, többen pedig az Amazon Mechanical Turk platformon keresztül segítették a képek kategorizálását.
Csak kis számú képet használtak a számítógép finomhangolásához, és ennek a tartomány-adaptációs folyamatnak az alkalmazásával megmutatták, hogy javítani tudják a Twitter-képek hangulat-elemzésének korszerű módszereit.
Az egyik meglepő megállapítás az, hogy a képi hangulatosztályozás pontossága meghaladta az ugyanazon Twitter-üzenetek szövegérzékelésének pontosságát.
Forrás: Rochesteri Egyetem