Sia il comune raffreddore che l'influenza ti faranno sentire infelice, e poiché entrambi sono infezioni respiratorie con sintomi simili - tosse, dolore, mal di testa, conosci il trapano - può essere difficile sapere quale ti tiene nella sua presa.
Ogni anno, dal 5 al 20 percento della popolazione degli Stati Uniti contrae l'influenza, principalmente durante quel periodo invernale tra dicembre e febbraio, per alcuni mesi [fonte: CDC ]. Mentre molti malati troveranno sollievo nei farmaci da banco, l'influenza può essere grave. Le complicanze legate all'influenza possono richiedere il ricovero in ospedale e talvolta le complicanze possono essere fatali. L'influenza, insieme alla polmonite (entrambe sono infezioni delle basse vie respiratorie), è stata classificata come l'ottava principale causa di morte negli Stati Uniti nel 2010 e le infezioni respiratorie sono state la terza causa di morte nel mondo quell'anno (ben 3,2 milioni di persone) [fonte : CDC , CNBC ].
Poiché l'influenza stagionale può causare gravi complicazioni, i Centers for Disease Control and Prevention (CDC) monitorano le malattie simil-influenzali (ILI) negli Stati Uniti, monitorando e analizzando l'attività influenzale per ottenere un buon quadro del tasso di incidenza, della percentuale di prevalenza e del tasso di occorrenza di ILI durante tutto l'anno [fonte: Harvard Health Publications ]. Ai fini del monitoraggio, il CDC considera una febbre di almeno 100 gradi Fahrenheit (37,8 gradi Celsius) con tosse e/o mal di gola come un ILI.
Il CDC monitora questi numeri con i dati raccolti attraverso più fonti, inclusi i dipartimenti sanitari locali e statali, 122 uffici di salute pubblica e statistica vitale, quasi 3.000 strutture sanitarie ambulatoriali, più di 270 laboratori e rapporti dal sistema di sorveglianza FluSurv-NET [fonte : CDC ]. Tutti questi pezzi sono suddivisi in cinque categorie di informazioni utilizzabili:
- Sorveglianza virale : rapporti di laboratorio sul numero di campioni respiratori prelevati quella settimana e quale percentuale era, in effetti, confermata l'influenza
- Mortalità : dati sulla proporzione di decessi correlati a polmonite e influenza (P&I) e segnalazioni di decessi pediatrici associati all'influenza
- Ricoveri : confermati ricoveri correlati all'influenza
- Sorveglianza delle malattie ambulatoriali : monitoraggio del numero di visite ambulatoriali per ILI
- Diffusione geografica della malattia : il livello stimato di attività influenzale per stato, che potrebbe essere un'attività diffusa, regionale, locale, sporadica o assente
A partire dalla 40a settimana dell'anno, che è l'inizio della stagione influenzale da ottobre a maggio, il CDC distribuisce rapporti settimanali sull'attività influenzale.
Le informazioni diffuse dal CDC intendono essere un'istantanea delle attuali tendenze influenzali, non un numero specifico di persone che hanno contratto l'influenza durante quella stagione o anno influenzale. Il focus è se si stanno verificando focolai influenzali, dove viene segnalata l'influenza, quando è stata segnalata e quali virus influenzali sono da biasimare.
Sebbene i dati rilasciati dal CDC forniscano un quadro accurato delle tendenze influenzali, quei dati, una volta compilati e analizzati, risalgono anche a una o due settimane. Non può dirti se una nuova sacca di influenza è emersa in una città specifica nel fine settimana precedente, ma è utile per misurare l'impatto complessivo dell'influenza sulla popolazione degli Stati Uniti, oltre a fornire raccomandazioni sulla salute pubblica relative all'influenza.
Ad esempio, monitorando quali ceppi di influenza circolavano nella stagione influenzale 2014, gli epidemiologi del CDC sono stati in grado di dire con i dati raccolti tra il 1 ottobre e il 22 novembre che uno dei tre ceppi scelti inclusi nel vaccino antinfluenzale di quell'anno era mutato, e il vaccino sarebbe meno efficace in quella stagione.
E se volessi saperne di più sull'epidemia di influenza che si sta diffondendo in una città vicina? Google vorrebbe aiutare con questo.
Informazioni sulle tendenze influenzali di Google
Ben il 72% degli adulti americani ammette di aver cercato informazioni sanitarie online nell'ultimo anno: si tratta di circa 90 milioni di persone, per lo più alla ricerca di informazioni su condizioni specifiche come tosse o influenza, o trattamenti come antibiotici. E più di tre quarti di coloro che cercano informazioni sanitarie online iniziano la loro ricerca su Google, Bing o Yahoo [fonti: Fox , Ginsberg ]. Pensa a che tipo di informazioni si trovano nei database dei motori di ricerca. Ebbene, Google l'ha fatto.
Google Flu Trends (GFT) è uno strumento di sorveglianza dell'influenza basato su Internet che utilizza i dati aggregati delle query di ricerca per prevedere le tendenze dell'influenza in più di 25 paesi, inclusi gli Stati Uniti. Il progetto è iniziato nel 2008 come iniziativa del braccio filantropico di Google, Google.org, dopo che l'idea è nata dai picchi stagionali osservati di alcuni tipi di termini di ricerca.
Ad esempio, quando colpiscono le allergie primaverili, è più probabile che cercheremo antistaminici rispetto alla stagione influenzale invernale, quando è più probabile che cercheremo informazioni sui nostri sintomi di raffreddore e influenza come febbre o brividi.
Gli ingegneri di Google hanno utilizzato cinque anni di big data storici e intendiamo grandi. Hanno attinto al loro database di 50 milioni delle query di ricerca prefiltrate più comunemente utilizzate per stabilire una linea di base dell'attività influenzale generale. L'algoritmo iniziale per lo strumento di previsione si basava esclusivamente su dati di ricerca relativi all'influenza regionale (regionale in base all'indirizzo IP), inclusi argomenti generali come sintomi generali dell'influenza, rimedi contro il raffreddore e farmaci antivirali.
L'algoritmo confronta i dati della query di ricerca in tempo reale - la parola o la frase che hai utilizzato come termine di ricerca, come "mal di gola" - con la linea di base per determinare i livelli di attività influenzale regionale, che vanno da cinque classificazioni da minima a intensa. Teoricamente, GFT potrebbe fornire report attuali (quasi in tempo reale) dell'attività influenzale e prevedere focolai influenzali settimane prima che il CDC compili un rapporto.
Secondo gli inventori di GFT, tuttavia, la segnalazione in tempo reale di GFT è pensata per essere utilizzata come informazione complementare ai dati clinici e virologici nella sorveglianza tradizionale (il CDC e le sue reti). Il rilevamento rapido di GFT ha lo scopo di aiutare a rilevare precocemente non solo le epidemie di influenza, ma anche l'identificazione di ceppi virali e il potenziale di pandemie.
GFT: Aggiornamenti dei modelli, accuratezza e Big Data Trap
Prima della stagione influenzale di ogni nuovo anno, il modello Google Flu Trends viene aggiornato con 45 delle più utili query relative all'influenza degli anni precedenti (questi termini di ricerca speciali vengono scelti utilizzando la regressione logistica, ma le query esatte e il modo in cui vengono ponderate rispetto a altri sono tenuti top secret).
Inoltre, le stime post-stagione di GFT vengono valutate rispetto ai tradizionali rapporti di sorveglianza dei dati utilizzati dal CDC per vedere quanto bene i due corrispondano. Sulla base della capacità dello strumento di previsione di stimare con precisione quando inizia la stagione influenzale di quell'anno, quando la stagione raggiungerà il picco e quanto grave sarà, il modello può essere aggiornato. Quando è stato lanciato per la prima volta nel 2008, GFT aveva una correlazione media del 97% con i dati CDC [fonte: Ginsberg ].
Nel settembre 2009, il modello per la versione statunitense di Google Flu Trends ha ottenuto il suo primo aggiornamento per includere i dati delle query di ricerca dall'epidemia di H1N1. Questo perché il modello di GFT aveva completamente sottovalutato la pandemia di influenza suina H1N1 (avvenuta in estate). E poi ha continuato a mancare il bersaglio.
Durante la stagione influenzale 2011/2012, GFT ha sopravvalutato la prevalenza dell'influenza del 50%. GFT ha anche sovrastimato la stagione influenzale 2012/2013, prevedendo fino al doppio del numero di visite ambulatoriali relative all'ILI rispetto a quanto effettivamente riportato dal CDC. Al culmine della stagione influenzale 2013/2014, GFT ha stimato che fino all'11% della popolazione statunitense aveva l'influenza. Se sembra molto, è perché lo è: il CDC, in confronto, ha riportato il 6% in quella stagione. I ricercatori riferiscono che l'accuratezza dello strumento potrebbe in realtà essere molto peggiore; hanno scoperto che a partire da agosto 2011 GFT aveva sovrastimato in 100 settimane su 108 [fonti: Hodson , Walsh , Lazer ].
La spiegazione più comune per la sovrastima della prevalenza dell'influenza di Google non è altro che la nostra stessa ansia quando la stagione influenzale è in arrivo: sai, quando cerchi la parola "tosse" nel tentativo di capire se stai venendo giù con l'influenza, un freddo o, forse, aspetta, potrebbe essere la polmonite? Anche l'uso da parte dei media di frasi come "la peggiore stagione influenzale degli ultimi anni" e i resoconti dei media sull'influenza stagionale contribuiscono alle nostre ricerche ossessionate dalla tosse. Il problema è che GFT non sa se sei malato o solo preoccupato di ammalarti; considera che solo il 10 percento circa di tutte le persone che cercano assistenza medica per l'influenza ha effettivamente l'influenza [fonte: Salzberg ]. Le ricerche su Google non hanno contesto e non conoscono le tue intenzioni.
Ma questa potrebbe non essere la risposta completa.
Oltre al clamore dei media relativo a ILI che gonfia le ricerche sull'influenza, lavorare con i big data può portare a correlazioni che potrebbero non essere accurate. È la trappola dei big data. Sebbene i risultati dell'estrazione dei dati possano rappresentare una relazione tra le query di ricerca stagionali e, ad esempio, le visite mediche, l'enorme massa del set di dati suggerisce che non ci si può fidare dell'accuratezza della correlazione.
Un'altra domanda sulla sovrastima di GFT risiede negli aggiornamenti dell'algoritmo del motore di ricerca di Google. I ricercatori propongono che l'introduzione della funzione di suggerimento automatico nella Ricerca Google abbia modificato il comportamento degli utenti per il potenziale di sovrastima in GFT; gli utenti che cercavano un sintomo influenzale venivano ora incoraggiati a cercare più termini (consigliati da Google) relativi all'influenza, influenzando le ricerche generali relative a ILI.
Nel 2012 il motore di ricerca ha iniziato a includere possibili condizioni legate ai sintomi interrogati, aggiungendo potenzialmente anche il problema della sovrastima.
Tuttavia, dopo le scarse prestazioni di nuovo nella stagione influenzale 2012/2013, l'algoritmo di GFT è stato nuovamente aggiornato. Ora minimizza le irregolarità guidate dai media e fa le sue previsioni sulla base di un metodo statistico chiamato ElasticNet (che è un modello lineare generalizzato di regressione regolarizzata). Ma c'era ancora spazio per miglioramenti; l'algoritmo rivisto è ancora sopravvalutato fino al 30 percento [fonte: Lohr ].
Nel 2014, gli ingegneri GFT hanno aggiornato lo strumento GFT per includere non solo i dati di ricerca aggiornati, ma anche i cosiddetti piccoli dati clinici e virologici tradizionali del CDC per la stagione influenzale 2014/2015. Sia gli ingegneri che gli scienziati concordano che una combinazione di queste informazioni dovrebbe portare a risultati più accurati.
Molte più informazioni
Nota dell'autore: come funzionano Google Flu Trends
Che settimana per immergerti nell'influenza; il giorno in cui stavo scrivendo su come il CDC monitora e analizza i dati sull'influenza è stato lo stesso giorno in cui i funzionari sanitari del CDC hanno annunciato che la stagione influenzale di quest'anno potrebbe essere grave, perché uno dei ceppi virali (e quello più dominante finora in questa stagione) utilizzato nel vaccino di quest'anno è mutato. Tieni d'occhio Google Flu Trends.
articoli Correlati
- Devo fare un vaccino antinfluenzale?
- Come funziona Google
- Perché l'algoritmo di Google è così importante?
- Come si diffonde l'influenza?
- 14 rimedi casalinghi per l'influenza
Altri ottimi collegamenti
- Google.org - Tendenze influenzali (GFT)
- CDC - Rapporto settimanale sulla sorveglianza dell'influenza negli Stati Uniti
- CDC - Influenza stagionale: nozioni di base sull'influenza
Fonti
- Arce, Nicole. "Google Flu Trends ha sbagliato: lo strumento di previsione dell'influenza viene aggiornato". Tempi tecnologici. 1 novembre 2014. (5 dicembre 2014) http://www.techtimes.com/articles/19247/20141101/google-flu-trends-got-it-wrong-flu-prediction-tool-gets-updated .htm
- Artù, Carlo. "Google Flu Trends non è più bravo a prevedere l'influenza, scoprono gli scienziati". Il guardiano. 27 marzo 2014. (5 dicembre 2014) http://www.theguardian.com/technology/2014/mar/27/google-flu-trends-predicting-flu
- Maggiordomo, Declan. "Quando Google ha sbagliato l'influenza." Natura. 13 febbraio 2013. (5 dicembre 2014) http://www.nature.com/news/when-google-got-flu-wrong-1.12413
- Centri per il controllo e la prevenzione delle malattie. "Decessi: dati finali per il 2011." (5 dicembre 2014) http://www.cdc.gov/nchs/data/nvsr/nvsr63/nvsr63_03.pdf
- Centri per il controllo e la prevenzione delle malattie. "Influenza (influenza)." 4 dicembre 2014. (5 dicembre 2014) http://www.cdc.gov/flu/
- CNBC. "Le 10 principali cause di morte nel mondo". (5 dicembre 2014) http://www.cnbc.com/id/101388499/page/1
- Copland, Patrizio. "Tendenze della malattia di Google: un aggiornamento". Google.org. (5 dicembre 2014) http://static.googleusercontent.com/external_content/untrusted_dlcp/research.google.com/en/us/pubs/archive/41763.pdf
- Volpe, Susanna. "La vita sociale dell'informazione sanitaria". Pew Research Center. 15 gennaio 2014.(5 dicembre 2014) http://www.pewresearch.org/fact-tank/2014/01/15/the-social-life-of-health-information/
- Fung, Kaiser. "Il fallimento di Google Flu Trends mostra buoni dati > Big Data". Harvard Business Review. 25 marzo 2014. (5 dicembre 2014) https://hbr.org/2014/03/google-flu-trends-failure-shows-good-data-big-data/
- Ginsberg, Jeremy. "Lettera: rilevamento di epidemie di influenza utilizzando i dati delle query dei motori di ricerca". Natura. vol. 457. Pagine 1012-1014. 19 febbraio 2009. (5 dicembre 2014) http://www.nature.com/nature/journal/v457/n7232/suppinfo/nature07634.html
- Goldschmidt, Debra. "CDC: vaccino antinfluenzale meno efficace quest'anno perché il virus attuale è mutato". CNN. 4 dicembre 2014. (5 dicembre 2014) http://www.cnn.com/2014/12/04/health/flu-vaccine-mutated-virus/
- Google.org. "Tendenze influenzali". 2014. (5 dicembre 2014) http://www.google.org/flutrends/
- Harvard Medical School - Università di Harvard. "10 miti sull'influenza". (5 dicembre 2014) http://www.health.harvard.edu/flu-resource-center/10-flu-myths.htm
- Hodson, Hal. "Google Flu Trends sbaglia tre anni consecutivi." Nuovo scienziato. 13 marzo 2014. (5 dicembre 2014) http://www.newscientist.com/article/dn25217-google-flu-trends-gets-it-wrong-three-years-running.html
- Lazer, David. "Google Flu Trends sembra ancora malato: una valutazione della stagione influenzale 2013-2014". Rete di ricerca sulle scienze sociali. 13 marzo 2014. (5 dicembre 2014) http://papers.ssrn.com/sol3/papers.cfm?abstract_id=2408560
- Lazer, David. "La parabola dell'influenza di Google: trappole nell'analisi dei big data". Scienza. vol. 343, n. 6176, pagine 1203-1205. 14 marzo 2014. (5 dicembre 2014) http://www.sciencemag.org/content/343/6176/1203
- Lohr, Steve. "Trend dell'influenza di Google: i limiti dei big data". Il New York Times. 28 marzo 2014. (5 dicembre 2014) http://bits.blogs.nytimes.com/2014/03/28/google-flu-trends-the-limits-of-big-data/
- Oremo, Will. "Diventare virale". Ardesia. 9 gennaio 2013. (5 dicembre 2014) http://www.slate.com/articles/technology/technology/2013/01/flu_shot_time_google_flu_trends_predicts_worst_season_on_record.html
- Salzberg, Steven. "Perché l'influenza di Google è un fallimento." Forbes. 23 marzo 2014. (5 dicembre 2014) http://www.forbes.com/sites/stevensalzberg/2014/03/23/why-google-flu-is-a-failure/
- Stefansen, Cristiano. "Google Flu Trends ottiene un motore nuovo di zecca." Blog di ricerca di Google - Google. 31 ottobre 2014. (5 dicembre 2014) http://googleresearch.blogspot.com/2014/10/google-flu-trends-gets-brand-new-engine.html
- Stromberg, Giuseppe. "Perché Google Flu Trends non è in grado di monitorare l'influenza (ancora)." Rivista Smithoniana. 13 marzo 2014. (5 dicembre 2014) http://www.smithsonianmag.com/ist/?next=/science-nature/why-google-flu-trends-cant-track-flu-yet-180950076/
- Walsh, Bryan. "Il progetto Flu di Google mostra i difetti dei big data". Tempo. 13 marzo 2014. (5 dicembre 2014) http://time.com/23782/google-flu-trends-big-data-problems/