A (Válogatott) tömeg bölcsessége

Egyre több vállalat használja ügyfelei és felhasználói bölcsességét - nagyon válogatott tömeg. Ezt „nagy adatokon” keresztül teszik meg - névtelen adatok kincsesbányáit gyűjtik, majd post-hoc elemzéseket futtatnak rajta.

Ez az erőfeszítés érdekes felismerésekhez vezethet. Ez arra is késztetheti a vállalatokat, hogy az eredmények általánosíthatók legyenek a teljes lakosság számára.

És ez utóbbi kérdés a probléma. Mert ha önállóan kiválasztott mintával indul, akkor az adatai csak a hozzájuk hasonló emberekre vonatkoznak - nem az egész népességre. Ez csak az egyik probléma a kiválasztott tömegektől kapott információk alapján történő mérés - és cselekvés - terén.

A weboldalak már közel 20 éve végeznek „nagy adat” méréseket. Minden alkalommal, amikor meglátogat egy weboldalt, egy kis adatnyomot hagy a weboldal szerverén. A szerver tulajdonosai elveszik ezeket az adatokat, és egy adatelemző platformon (például a Google Analyticsen) keresztül futtatják. Összefoglaló információt ad a weboldal tulajdonosának arról, hogy milyen típusú emberek látogatják a weboldalukat.

Mivel minden webhely egyedi, az ilyen információk csak az adott webhelyre vonatkoznak. Például a CNN-t felkereső felhasználónak kevés közös vonása lehet a Match.com-ot felkereső felhasználóval.

A Tömegek kiválasztása probléma

Az adatelemzés során a statisztikusok az ilyen mintavételt „saját maguk által kiválasztott mintának” nevezik, ami „önszelekciós torzítás” problémáját eredményezi. Egyszerűen fogalmazva, ez azt jelenti, hogy mivel az Ön adatai csak olyan emberektől származnak, akik egy adott alkalmazást vagy egyfajta közösségi médiát használnak, nem reprezentálják a lakosság egészét. És mivel ez nem reprezentatív a lakosság egészére nézve, nem lehet általánosítani az adatokról.

Ezt hívom „kiválasztott tömeg” problémának. Mert ha bölcsességét szerzi a tömegtől, akkor jobb, ha megbizonyosodik arról, hogy ez a tömeg reprezentálja a lakosságot, ha általánosítható betekintést szeretne szerezni belőle.

Vannak egész vállalatok, akik nem tesznek mást, mint elemzik a trendeket és a Twitter adatait. De ha megnézed, hogy ki használja a Twittert - és hogyan használják -, akkor azonnal aggódna, hogy mit is jelentenek valójában az ilyen adatok. Például a Twitter felhasználói sokkal fiatalabbak, mint az általános népesség, és az idősebb emberek jelentősen alulreprezentáltak. Ha olyan vállalatot működtet, amely az egészségügyi trendeket nézi a Twitteren, egészen mást fog látni, mint ha véletlenszerű telefonos felmérést végzett.

Más szavakkal: a Twitteren milyen trendeknek lehet vagy nincs jelentősége az amerikaiak több mint 80 százaléka számára, akik nem használják a Twittert.

Az alkalmazások nem jobbak

Az alkalmazások gyakran szeretik összegyűjteni felhasználói adataikat, névtelenné tenni őket, majd felhasználni a teljesítményük összehasonlításához másokkal, akik szintén használják az alkalmazást. Állítólag ettől úgy fogja érezni magát, mintha egy olyan társadalmi hálózat része lenne, amelyben közös az alkalmazás. Remek ötlet.

Mert mi van, ha csak egy bizonyos típusú ember használja az adott alkalmazást? Mi lenne, ha csak a depressziós emberek használnának egy hangulatkövető alkalmazást, amelynek célja az emberek kiszabadítása a depresszióból azáltal, hogy segít nyomon követni hangulatukat, összehasonlítva a fejlődésüket másokkal, akik szintén használják az alkalmazást? Az ilyen eredmények önkéntelenül is nyomasztóak lehetnek.

Tud-e valakit pozitívan motiválni a társadalmi összehasonlítás révén? Megteheti, de túl gyakran a kutatás azt is megmutatja, hogy az ilyen társadalmi összehasonlítások miatt az emberek rosszabbul érzik magukat, mint korábban. Igényesen gondosan kell elvégezni - amit a legtöbb tipikus alkalmazásfejlesztő nem ért.

Fontos mérhető dolgok kihagyása

Bármely alkalmazás vagy szolgáltatás csak annyira jó, mint a mérni kívánt dolgok. Az elfogultságot - szándékosan vagy akaratlanul - beillesztheti az eredményeibe azáltal, hogy a mérés mellett dönt, és nem mér.

Gondoljon így: arra gondol, hogy új városba költözik, kevesebb esővel, ezért csak a különböző városok átlagos éves esőmennyiségét vizsgálja. Felnézne egy olyan városba, mint Miami, és így gondolkodna: „Tudja, nem költözök Miamiba - évente közel 62 hüvelyk esőt kapnak! Hasonlítsa össze ezt a csekély 37 hüvelykes esővel, amelyet Seattle kap. Seattle-nek a naposabb, kevésbé esős helynek kell lennie. " Mivel nem vett be más fontos mutatókat a mérésbe, a túl korlátozott információk alapján tévesen választott.

Amit egy alkalmazás vagy egy webhely fejlesztője fontosnak tart valaminek a mérésében, az valójában nem lehet annyira fontos, mint amit kihagytak. Képzeljen el egy olyan alkalmazást, amely csak a gyógyszeres reakciót méri, de a hangulathoz és a kezeléshez hozzájáruló összes többi fontos tényezőt kihagyja.

A kezelés nem vákuumban zajlik veled és egyetlen gyógyszerrel. Gazdag, összetett ökoszisztémában zajlik, amely tartalmazhat gyógyszert, de sok más fontos dolgot is magában foglal, hogy segítsen magának a gyógyulásban. Lehet, hogy mennyit edz, vagy nem kérődzik, vagy napokat tölt el anélkül, hogy pánikrohama lenne, vagy stresszt okozna egy családtagja vagy munkája miatt.

Röviden: számtalan olyan dolog van, amelyet az alkalmazásoknak és más jó szándékú szolgáltatásoknak nyomon kell követniük, de nem az. És ez torz perspektívát ad arról, hogy a mérendő valami hogyan kapcsolódik az ember hangulatához vagy a gyógyulás előrehaladásához. A gyógyszeres kezelés valóban fontos sok ember kezelésében, de lehet, hogy nem ez a legfontosabb - és gyakran nem is az.

!-- GDPR -->