Hogyan tudjuk kitalálni, melyik tweet hiteles
A Georgia Institute of Technology kutatói új nyelvi modellt dolgoztak ki, amely megmutatja, hogy mely szavak és kifejezések pozitívan vagy negatívan befolyásolják a Twitteren jelentett világesemények hitelességét.
A tanulmány, amely 66 millió tweetet szkennelt közel 1400 valós esemény kapcsán, azt sugallja, hogy a közösségi médiában emberek millióinak szavai jelentõs információt nyújthatnak az esemény hitelességérõl, még akkor is, ha egy esemény még folyamatban van.
"Az elmúlt években számos tanulmány készült a közösségi média hitelességéről, de nagyon keveset tudunk arról, hogy a gyorsan kibontakozó események során milyen típusú szavak vagy kifejezések alkotnak hitelességi felfogást" - mondta Tanushree Mitra, a Georgia Tech Ph.D. jelölt, aki a kutatást vezette.
A csapat a 2014-es és 2015-ös világeseményekkel kapcsolatos tweeteket tanulmányozta, beleértve az Ebola nyugat-afrikai megjelenését, a párizsi Charlie Hebdo támadást és Eric Garner halálát New Yorkban.
A kutatók arra kérték az embereket, hogy ítéljék meg a bejegyzések hitelességét (a „biztosan pontos” és a „minden bizonnyal pontatlan” között). Ezután a csapat egy olyan modellbe táplálta a szavakat, amely 15 különböző nyelvi kategóriába sorolta őket. Az osztályozások pozitív és negatív érzelmeket, sövényeket és erősítőket, valamint szorongást tartalmaztak.
A Georgia Tech számítógép ezután megvizsgálta a szavakat, hogy megítélje, hogy a tweetek hitelesek-e vagy sem. Körülbelül 68 százalékban megfelelt az emberek véleményének, ami jelentősen magasabb, mint a véletlenszerű 25 százalékos alapvonal.
"Az erősítő szavakkal ellátott tweeteket, például a" tagadhatatlan ", és a pozitív érzelmi kifejezéseket, például a" lelkes "és a" fantasztikus ", nagyon hitelesnek tekintették" - mondta Mitra. „A pozitív hangulatot jelző, de az esemény kivitelezhetetlenségét gúnyoló szavakat, például„ ha ”,„ vigyorog ”vagy„ viccelődést ”kevésbé tekintették hitelesnek. Így voltak a fedezeti szavak is, beleértve a „bizonyos szintet” és a „gyanúsítottakat”. ”
A nagyobb számú retweet alacsonyabb hitelességi pontszámmal járt.Úgy vélték, hogy a hosszabb üzenethosszú válaszok és retweetek hitelesebbek.
"Lehet, hogy a hosszabb üzenethossz több információt vagy érvelést nyújt, ezért megbízhatóbbnak tekintik őket" - mondta. "Másrészt a nagyobb számú retweet, amely a hitelességnél alacsonyabb pontszámot kapott, kísérletet jelenthet kollektív érvelés kiváltására válság vagy bizonytalanság idején."
Bár a modell még nem telepíthető, a kutatók szerint végül kifejlesztenek egy alkalmazást, amely kiszámíthatja az esemény észlelt megbízhatóságát, amint az a közösségi médiában kibontakozik.
"Más jelekkel, például eseménytémákkal vagy strukturális információkkal kombinálva nyelvi eredményünk az automatizált rendszer fontos építőköve lehet" - mondta Dr. Eric Gilbert, a Mitra tanácsadója és a Georgia Tech Interaktív Számítástechnikai Iskolájának adjunktusa.
„A Twitter része a valótlan hírek online terjesztésével kapcsolatos problémának. De része lehet a megoldásnak is. ”
Forrás: Georgia Institute of Technology