Pred dvoma týždňami internetový vyhľadávač Google privítal chrípkovú sezónu vskutku originálne. Používateľom ponúkol novátorskú službu: Google Flu Trends, ktorá monitoruje šírenie chrípkového vírusu v USA.
A to, prosím pekne, bez toho, že by sa čo i len jeden Američan dostavil do ordinácie doktora a dal sa seriózne vyšetriť. Postačia k tomu dáta z vyhľadávača.
V spolupráci s americkým Center for Disease Control and Prevention ľudia z googlovského tímu „Predpovedí a prevencie“ zistili, že za posledných päť rokov je početnosť vyhľadávaní na tému chrípka porovnateľná s reálnym počtom ľudí, u ktorých sa v danom období prejavili jej symptómy. I keď nie každý, kto si vyhľadáva informácie o chrípkovom ochorení, je práve chorobou postihnutý, a nie každý chorý si na internete potrebuje googliť chrípku, štatisticky krivka vyhľadávania informácií o chrípke kopíruje krivku jej skutočného výskytu.
Otázne je, načo je komu informácia o tom, že v jeho okrese zúri chrípka, či sa bude správať nejako inak, ako keď vidí všade chrchľajúcich ľudí s červenými nosmi. Pripomína mi to aplikáciu napojenú koldokola zemegule na nejaký americký satelit, kde sa zo svojho počítača dozviem presne to isté, ako keď otvorím okno – teda, aké je vonku počasie.
Epidemiológovia však jasajú. Informácie z Googlu totiž vidia v dennej periodicite, zatiaľ čo vyhodnocovanie reálnych údajov v ich centre trvá aj dva týždne. Horšie je to s pocitmi ľudí, ktorí si vážia svoju slobodu a anonymitu a každú takúto aplikáciu považujú za ich ohrozenie. Google sa dušuje, že dáta vyhodnocuje hromadne a anonymne, nič to však nemení na skutočnosti, že niekde sa dajú ľahko agregovať údaje o tom, čo hľadáme, a následne z toho vyvodzovať ďalekosiahle uzávery.
Rozmýšľam, ako sa brániť. Možno by pomohol automatický generátor googlenia, kde si nastavím falošné preferencie, ako chcem byť videná: napríklad vyšívanie, recepty na bábovky, vtipy o deťoch a vlastnoručné betlehemy. A svoje skutočne preferencie, bičíky, putá a koženú bielizeň skryjem za generátor IP adries, aby som sa štatisticky rozplynula dostratena.
A to, prosím pekne, bez toho, že by sa čo i len jeden Američan dostavil do ordinácie doktora a dal sa seriózne vyšetriť. Postačia k tomu dáta z vyhľadávača.
V spolupráci s americkým Center for Disease Control and Prevention ľudia z googlovského tímu „Predpovedí a prevencie“ zistili, že za posledných päť rokov je početnosť vyhľadávaní na tému chrípka porovnateľná s reálnym počtom ľudí, u ktorých sa v danom období prejavili jej symptómy. I keď nie každý, kto si vyhľadáva informácie o chrípkovom ochorení, je práve chorobou postihnutý, a nie každý chorý si na internete potrebuje googliť chrípku, štatisticky krivka vyhľadávania informácií o chrípke kopíruje krivku jej skutočného výskytu.
Otázne je, načo je komu informácia o tom, že v jeho okrese zúri chrípka, či sa bude správať nejako inak, ako keď vidí všade chrchľajúcich ľudí s červenými nosmi. Pripomína mi to aplikáciu napojenú koldokola zemegule na nejaký americký satelit, kde sa zo svojho počítača dozviem presne to isté, ako keď otvorím okno – teda, aké je vonku počasie.
Epidemiológovia však jasajú. Informácie z Googlu totiž vidia v dennej periodicite, zatiaľ čo vyhodnocovanie reálnych údajov v ich centre trvá aj dva týždne. Horšie je to s pocitmi ľudí, ktorí si vážia svoju slobodu a anonymitu a každú takúto aplikáciu považujú za ich ohrozenie. Google sa dušuje, že dáta vyhodnocuje hromadne a anonymne, nič to však nemení na skutočnosti, že niekde sa dajú ľahko agregovať údaje o tom, čo hľadáme, a následne z toho vyvodzovať ďalekosiahle uzávery.
Rozmýšľam, ako sa brániť. Možno by pomohol automatický generátor googlenia, kde si nastavím falošné preferencie, ako chcem byť videná: napríklad vyšívanie, recepty na bábovky, vtipy o deťoch a vlastnoručné betlehemy. A svoje skutočne preferencie, bičíky, putá a koženú bielizeň skryjem za generátor IP adries, aby som sa štatisticky rozplynula dostratena.
Ak ste našli chybu, napíšte na web@tyzden.sk.