menú

Googlet googlet, digue'm qui…

Google s'ha convertit en el nostre oracle, a qui ens dirigim quan necessitem informació, consell o fins i tot consol. Se'ns oblida, però, que els bons oracles, els de veritat, deien més sobre nosaltres mateixos que sobre el món que ens envolta. Bé, des de 2004, Google ha decidit explicar-nos també coses sobre nosaltres mateixos a través de la seva aplicació "Google Trends".

Il·lustració per Klifton Kleinmann.

Google Trends és un projecte que permet veure en quina mesura és popular una determinada paraula clau entre totes les cerques fetes a través de Google. Dit d’altra manera, mostra la freqüència amb la qual es busca un terme de cerca concret en relació amb el volum total de cerques. Aquesta eina ens permet restringir la cerca a una regió en particular i a un període de temps determinat. Per exemple, si busquem "tomàquet" al Regne Unit durant el 2015, Trends analitza un percentatge de totes les cerques a Google al Regne Unit el 2015 i ens diu en quin moment la paraula "tomàquet" va ser més popular en relació amb totes les cerques que els residents anglesos han fet el 2015. Google Trends també permet a l'usuari comparar el volum de cerques entre dos o més termes, entre dues o més regions i entre dos o més períodes de temps. Així, podem determinar si la paraula "tomàquet" era més popular el 2015 o el 2014, si era més popular al Regne Unit o a Austràlia (veure Figura 1) i si era més o menys popular que "pastanaga".

Figura 1. Captura de Google Trends, comparant la popularitat de tomato (tomàquet) al Regne Unit i a Austràlia.

Google Trends es utilitzat cada cop més entre les comunitats científiques de diverses disciplines. La medicina, per exemple, utilitza aquesta eina per conèixer en temps real l'evolució d'una epidèmia, o per detectar-ne una abans que els afectats arribin a les sales d'urgències. Molts pacients busquen símptomes o remeis casolans abans d'anar a un metge. Tenir accés a les dades sobre les cerques a la web, com les que proporciona Google Trends, anticipa la detecció de diverses epidèmies i proporciona un major marge de maniobra a les autoritats sanitàries.

El 2008, Google va desenvolupar "Google Flu Trends" (ara tancat), una aplicació que supervisava diverses paraules clau relacionades amb la grip i indicava el nivell d'incidència de la malaltia entre la població en una regió específica en temps real. Flu Trends podia detectar brots regionals de grip entre 7 i 10 dies abans de que ho poguessin fer els sistemes de monitorització convencionals dels centres de control i prevenció de malalties.

Flu Trends només supervisa els brots de grip i de dengue, però diversos autors han utilitzat Google Trends per detectar brots de moltes altres malalties o per detectar patrons estacionals de certs símptomes. La detecció dels patrons estacionals de certes malalties és sovint difícil amb les dades tradicionals, ja que, per exemple, algunes malalties no requereixen consulta mèdica. Investigadors com David Ingram, Llitera Matthews, Camille Pelat, David Planti i Louise Rossignol, entre altres, han investigat diversos patrons estacionals d’algunes malalties utilitzant Google Trends. Dues de les malalties que van estudiar –les infeccions del tracte urinari i el fet de roncar– semblen mostrar pics d'incidència marcats: tenim més infeccions urinàries a l'estiu i ronquem més a l'hivern i durant l'inici de la primavera. Per estudiar les infeccions urinàries, els autors no solament van utilitzar dades de Goolge Trends, sinó també dades de vendes de medicaments i van trobar el mateix patró estacionari, suggerint que Google Trends pot realment capturar l'estat de salut de la població amb l'avantatge que les dades de Google Trends són molt més fàcils de consultar.

La medicina no és l'única disciplina que ha sabut utilitzar aquestes dades per dir-nos coses sobre nosaltres mateixos. Alguns economistes han utilitzat Google Trends i han confirmat que la recerca de determinats mots clau són un excel·lent indicador de diversos elements de l'activitat econòmica, gairebé en temps real. Els indicadors tradicionals dels mateixos elements de l'activitat econòmica apareixen a les estadístiques oficials mesos o fins i tot anys després.

Considerem ara les estadístiques del sector immobiliari. No és estrany que, si les decisions de compra es fan amb suficient antelació, les recerques fetes a Google realment puguin predir el futur, ja que està clar que si paraules com "comprar casa" o "agència immobiliària" augmenten la seva popularitat entre les recerques de Google, és probable que d'aquí a unes setmanes o alguns mesos, el nombre de vendes de cases augmenti. Els economistes Hyunyoung Choi i Hal Varian van estudiar diverses fonts de dades sobre les vendes d'automòbils, la desocupació, la confiança del consumidor per comprar o les destinacions turístiques per a les properes vacances. Van trobar que els models d'estimació que incorporen Google Trends prediuen els valors reals entre 5 i 20% millor que els models que no els incorporen.

Els economistes Tobias Preis, Helen S. Moat i Eugene Stanley van utilitzar Google Trends per estudiar els mercats financers i van trobar que els canvis de tendència de la recerca de paraules relacionades amb les finances en Google, és molt útil per trobar "senyals d'alerta primerenca" de futures crisis en els mercats. Aquest tipus de dades és interessant en si mateix, ja que ens proporciona informació valuosa per entendre’ns millor a nosaltres mateixos, però també permet a les autoritats actuar amb més marge de maniobra i més informació davant possibles pertorbacions que afecten severament les societats com ara una epidèmia de grip o una crisi financera.

Quan em vaig adonar d'aquest potencial, també em vaig posar a buscar dades interessants a Google Trends. En primer lloc, vaig tractar d'entendre millor la informació exacta que Google Trends ens proporciona1. El enquadrat explica l'algoritme utilitzat per Google.

Per tal de mantenir l'anonimat dels usuaris, quan utilitzem Google Trends, el que obtenim no és el nombre total de cerques d'una paraula determinada, sinó un índex normalitzat del nombre de cerques:

Per exemple, per a una sola paraula clau cercada durant un període d'un any en una determinada regió, Google Trends determina, en un primer moment, la ràtio de popularitat per a cada setmana. Dins la regió, per a cada setmana, la ràtio de popularitat mostra el nombre de cerques de la paraula clau sobre el nombre total de cerques. Aquesta relació es normalitza a continuació, per tal de determinar l'índex normalitzat. Es normalitza proporcionalment de manera que 100 correspon a la ràtio de popularitat més alta de tot el període (en el nostre exemple d'un any). Per tant, un índex normalitzat de 50 vol dir que la paraula clau va ser la meitat de popular respecte a la setmana on l'índex normalitzat va ser de 100. Aquests tipus d'índexs permeten veure l'evolució del nombre de cerques d'una paraula clau en el temps, comparar la popularitat d'una paraula clau en diverses regions del món o comparar la popularitat entre diverses paraules clau.

Una vegada que estava clar quina informació proporciona Google Trends, vaig començar a buscar paraules que es relacionen amb els moviments socials com "canvi". Vaig buscar a Espanya entre abril de 2011 i gener de 2012. Atès que hi va haver un moviment social molt important al maig de 2011 a Espanya anomenat "15M" o "els indignats", m'esperava un pic o un canvi en la tendència al voltant de maig de 2011. Els resultats que vaig trobar estan representats a la figura 2.

Figura 2. Elaboració pròpia amb dades de Google Trends.

De manera sorprenent, no vaig trobar cap tipus de pic ni cap canvi de tendència clar al voltant de maig del 2011, però hi ha un pic a finals d'octubre. Immediatament, em vaig posar a buscar el que va passar a Espanya a l'octubre de 2011 i no vaig trobar res rellevant. Aleshores, vaig tractar de veure l'evolució de les cerques de la paraula "canvi" en un període més llarg, entre 2010 i 2015. Els resultats es poden veure a la figura 3.

Figura 3. Elaboració pròpia amb dades de Google Trends.

Podem veure clarament que hi ha pics a finals d'octubre i a finals de març que coincideixen amb el canvi d'hora que es produeix a Espanya entre l'hivern i l'estiu cada any a l'octubre i al març.

Vaig provar aleshores amb una altra paraula de significat similar però menys ambigu: "alternativa". Els resultats es mostren a la Figura 4.

Figura 4. Elaboració pròpia amb dades de Google Trends.

Aquesta vegada podem veure clarament un pic al maig de 2011, i els patrons són molt menys estacionals que els que observàvem amb "canvi". Aquest simple exercici mostra per què hom ha de tenir molta cura quan es treballa amb dades. Les dades de Google Trends són una eina molt pràctica i potent, però s'han d'utilitzar correctament o, en cas contrari, poden donar lloc a malentesos o, fins i tot, a conclusions falses.

Google s'ha convertit en un molt bon oracle que no solament ens pot dir una infinitat de coses sobre el món que ens envolta, sinó que també ens pot ensenyar molt sobre nosaltres mateixos. Cal anar amb compte, però, amb les preguntes que fem; de la mateixa manera que amb els bons oracles, els de veritat, hem de triar les nostres preguntes amb saviesa.

Bibliografia

  • Choi, H., & Varian, H. (2012). Predicting the present with Google Trends. Economic Record, 88(s1), 2-9.
  • Ingram, D. G., Matthews, C. K., & Plante, D. T. (2014). Seasonal trends in sleep-disordered breathing: evidence from Internet search engine query data. Sleep and Breathing, 1-6.
  • Preis, T., Moat, H. S., & Stanley, H. E. (2013). Quantifying trading behavior in financial markets using Google Trends. Scientific reports, 3.
  • Rossignol, L., Pelat, C., Lambert, B., Flahault, A., Chartier-Kastler, E., & Hanslik, T. (2013). A Method to Assess Seasonality of Urinary Tract Infections Based on Medication Sales and Google Trends. PLoS ONE, 8(10), e76020. doi:10.1371/journal.pone.0076020

Notes


  1. A l'explicació que segueix de l'índex, presento solement el cas on l'hom s'interessa en un únic mot clau.