Rossz kutatás: Népszerű szexkeresési kifejezések
Ogi Ogas és Sai Gaddam kutatók nemrég kiadtak egy könyvet, Milliárd gonosz gondolat, részletezve a Dogpile keresőből összegyűjtött 400 millió keresés elemzését. A 400 millió keresés 13 százaléka (55 millió) erotikus tartalomra irányult.
Hogyan bomlott le az az 55 millió keresés? Tudjuk meg ... de nézzük meg e kutatók módszertanát is, hogy megállapításaik megérjék-e azt a papírt, amelyre kinyomtatták őket. (Ha nem gondolja, valószínűleg igaza van.)
Tehát itt keresik a Dogpile-ben élő emberek, ha szexuális érdeklődésről van szó. Ne feledje, hogy az alábbi kifejezések az adott érdeklődés általános kategóriája, amely magában foglalja a kifejezések mindenféle permutációját. Ezeket a permutációkat (például a mell „mellét”) az alábbiakban nem soroljuk fel; használd a képzeleted.
- Ifjúsági - 13,5 százalék
- Meleg - 4,7 százalék
- Menyecskék (Anya, akit szeretnék F ***) - 4,3 százalék
- Mellek - 4,0 százalék
- Csaló feleségek - 3,4 százalék
- Hüvely - 2,8 százalék
- Péniszek - 2,4 százalék
Szemét be, szemét ki
Van egy régi mondás a számítógépes programozásban - GIGO: Garbage In, Garbage Out. Ugyanolyan jól alkalmazható minden tudományos törekvésre, amely csak annyira jó, mint az elemezni kívánt adatok. Ha megkérdőjelezhető általánosíthatósággal vagy értékkel rendelkező adathalmazból indul ki, akkor azon a következtetéseken vehet részt, amelyek kevéssé kapcsolódnak a valósághoz.
Ebben az esetben óriási probléma van a kutatók által összeállított kutatási adatokkal. Nem a Google-től vagy akár a Bingtől származnak. A „Dogpile” nevű, kevéssé ismert keresőről származnak, amely nem is keresőmotor. Ami a Dogpile, az egyszerűen a Google, a Yahoo és a Bing keresési eredményeinek összesítő motorja (mivel a Bing mostantól biztosítja a Yahoo számára a keresési adataikat, nem vagyok biztos benne, miért van még mindig ez a differenciálás).
Ez nem azonos a Google-on a Google.com-on keresztül végzett kereséssel, vagy a Bing-en a Bing.com-on keresztül végzett kereséssel. Valójában meg kell látogatnia a Dogpile webhelyét, hogy megkapja ezeket az eredményeket - ezek az eredmények képezték az adatkészletet a jelenlegi kutatók számára. Ha a Google.com-on végez keresést, akkor ezeket a kutatókat nem elemezték volna (ennek van értelme, mivel a Google és a Bing nem teszi a kutatók számára könnyen elérhetővé a keresések során gyűjtött adatokat).
A Dogpile valószínűleg kevéssé használható az a tény, hogy a szponzorált keresési hirdetéseket összekeveri az organikus keresési eredményekkel, gyakorlatilag vizuális jelzés nélkül. Az egyes keresési eredmények végén található apró nyomtatással megtudhatja, hogy „szponzorált” eredményről van-e szó - pl. Hirdetés. A Dogpile-n a „depresszió” keresése során az első 20 találat közül 14 hirdetés volt - nem éppen ez, amit a legtöbb hétköznapi ember nagyon sokáig kibírna.
Az online tartalmat kereső emberek régóta elhatározták, hogy felhagynak a keresőmotorok használatával, amelyek megpróbálják összekeverni a hirdetést a tényleges eredményekkel. Az ok egyszerű - az emberek akkor kattintsanak egy hirdetésre, ha érdeklik őket a kínált termék vagy szolgáltatás. Nem szeretik, ha becsapják őket, amikor rákattintanak a szerintük keresési eredményre, csak azért, hogy kiderítsék, álcázott hirdetésről van szó.
Tehát ki használja a Dogpile-t? Ki tudja, de valószínűleg nem lesz mainstream internet-felhasználó. Míg több mint 150 millió ember használja a Google-t, és 90 millióan a Bing.com-ot használják, addig a Dogpile havi 2-3 millió embere halványabb, és jóval kevesebb, mint a teljes keresőmotor-piac 0,05 százaléka.
Tudna-e felmérést végezni egy ilyen apró adatkészleten, és kipróbálni a füstöt és a tükröket, hogy úgy tűnjön, valóban ugyanolyan úttörő kutatásokat végzett, mint a Kinsey Intézet az 1950-es és 1960-as években? Biztosan lehet.
Például Ogi Ogas és Sai Gaddam szerint 400 millió internetes keresést elemeztek. De hasonlítsa össze ezt a számot a mindennap elvégzett 3 milliárd kereséssel - állítja a Hitwise online elemző cég. Hirtelen 400 millió - bár látszólag lenyűgöző szám a vákuumban - sokkal kevésbé tűnik lenyűgözőnek, ha valamilyen adatkörnyezetbe kerül. 400 millió keresés felel meg annak, amit körülbelül 3 óra alatt végeztek. Egy nap alatt.
A kontextus természetesen minden, amikor az adathalmazokról van szó, különösen akkor, ha ezek az adathalmazok valószínűleg elfogultak olyan módon, amelyet soha nem vett fáradságot a kivizsgáláshoz. Ebben az esetben az adatkészlet elfogult a Dogpile keresőmotor használatával - egy apró, hiányos keresőmotorral, amelyet nagyobb valószínűséggel használ, mint amelyet nem használ a populáció egy bizonyos része, amely eltér a populáció többi részétől.
Tehát vegye ezt a listát egy szem sóval. Érdekes, de nem vagyok biztos benne, hogy tükrözi-e a lakosságot. És bizony nem érdemes egy egész könyvet vásárolni, amely elmélyül ebben a hibás adatkészletben.