menu

Google Trends, mon beau Google, dis-moi qui…

Google est devenu notre oracle, celui vers lequel on se tourne quand nous avons besoin d’être informés, conseillés ou même rassurés. Nous oublions que les bons oracles, les authentiques, parlent plus de nous-mêmes que du monde qui nous entoure. Eh bien, depuis 2004, Google a décidé de parler de nous avec son service « Google Trends ».

Illustration par Klifton Kleinmann.

Trends est un projet qui permet de visualiser la popularité de certains mots clés parmi toutes les recherches effectuées sur Google. Autrement dit, il nous indique combien de fois un terme est utilisé relativement à l’ensemble des recherches. Et l’étude peut être restreinte à une région particulière et dans une fenêtre de temps donnée. Par exemple, si nous cherchons le mot « tomato » au Royaume-Uni en 2015, Google Trends analyse un pourcentage de toutes les recherches faites sur Google depuis le Royaume-Uni en 2015 et nous indique dans quelle mesure le terme « tomato » est populaire parmi toutes les recherches effectuées par les résidents anglophones.

Google Trends permet aussi à l’utilisateur de comparer le volume des requêtes entre deux termes différents (ou plus), entre deux régions (ou plus) ou entre deux périodes temporelles (ou plus). Ainsi, nous pouvons comparer si le mot « tomato » était plus populaire en 2015 qu’en 2014, s’il était plus populaire au Royaume-Uni qu’en Australie (voir la figure 1) et s’il était plus ou moins populaire que « carrot ».

Figure 1.Capture d’écran de Google Trends, comparant la popularité du mot « tomato » au Royaume-Uni et en Australie.

Google Trends a gagné une certaine popularité dans les communautés de différentes disciplines scientifiques. La médecine, par exemple, utilise cet outil pour savoir en temps réel quelle est l’évolution d’une épidémie, voire même pour détecter une épidémie avant même que les personnes infectées ne se rendent dans les services d’urgence. Beaucoup de patients recherchent en effet les symptômes ou des remèdes maison pour leur maladie avant d’aller consulter leur docteur. Avoir accès à des informations sur les recherches des internautes, comme celles données par Google Trends, permet d’anticiper la détection de plusieurs épidémies et fournit une meilleure marge de manœuvre pour les autorités sanitaires.

Ainsi en 2008, Google a développé « Google Flu Trends » (désormais fermé), un utilitaire qui surveillait l’utilisation de plusieurs mots clés liés à la grippe et indiquait ainsi le niveau d’incidence de la maladie dans la population d’une région spécifique en temps réel. Flu Trends a pu détecter l’arrivée de la grippe avec 7 à 10 jours d’avance sur les mécanismes classiques des organismes de veille sanitaire.

Flu Trends a suivi de même l’évolution de la dengue et d’autres auteurs ont utilisé Google Trends pour détecter l’évolution de certaines autres maladies ou pour déceler le caractère saisonnier de certains symptômes. En effet, détecter des phénomènes saisonniers sur certaines maladies est souvent difficile avec des données traditionnelles, car toutes ne nécessitent pas forcément une visite médicale. Des chercheurs comme David Ingram, Camilla Matthews, Camille Pelat, David Plante et Louise Rossignol ont pu enquêter sur plusieurs phénomènes saisonniers de maladies en utilisant Google Trends. Par exemple, deux des maladies étudiées, les infections urinaires et les ronflements, semblent avoir des pics marqués d’incidence. Les infections urinaires sont plus fréquentes en été et l’on ronfle plus en hiver ou au début du printemps. En parallèle des données de Google Trends, les chercheurs examinent aussi les ventes de médicaments ; dans le cas des infections urinaires, les courbes suivent le même profil. Cela semble ainsi montrer que Google Trends peut capturer un réel état de la santé d’une population, et ce, avec l’avantage d’être très simple à consulter.

La médecine n’est pas la seule discipline qui a réussi à utiliser ces données pour en apprendre plus sur nous-mêmes. Plusieurs économistes ont utilisé Google Trends et ont confirmé que les clics dans la barre de recherche sont un excellent indicateur de plusieurs éléments de l’activité économique, et ce, quasiment en temps réel. Sur les mêmes éléments, les indicateurs traditionnels n’apparaîtront dans les statistiques officielles que des mois, voire des années, plus tard.

Considérons par exemple les statistiques de l’immobilier : ce n’est pas surprenant que, si les décisions d’acheter sont prises en avance, les recherches sur Google peuvent vraiment prédire le futur. En effet, si les requêtes telles qu’« acheter maison » ou « immobilier » augmentent en popularité dans les recherches Google, il est probable que dans les semaines suivantes, les ventes réelles de maisons augmentent. De même, les économistes Hyunyoung Choi et Hal Varian ont étudié plusieurs sources d’information sur les ventes de voitures, le chômage, la confiance des consommateurs ou les destinations touristiques. Ils ont trouvé que les modèles d’estimation qui incorporent Google Trends prédisent les valeurs réelles de 5 % à 20 % mieux que les modèles qui ne le prennent pas en compte.

Les économistes Tobias Preis, Helen S. Moat et Eugene Stanley ont utilisé Google Trends pour étudier les marchés financiers ; ils ont montré que les changements de tendances dans les recherches sur Google liées à la finance sont très utiles pour trouver « des signaux alarmants précoces » de futurs chocs sur les marchés. Ce type de donnée est intéressant en soi, car il fournit des informations précieuses pour mieux nous comprendre ; mais cela permet aussi aux autorités d’agir avec plus d’aisance et d’information face à différents chocs possibles, tels que les épidémies de grippe ou les crises économiques, qui ont chacune un profond impact sur la société.

Quand je me suis rendue compte de ce potentiel, je me suis mise à mon tour à chercher des données intéressantes sur Google Trends. Premièrement, j’ai essayé de comprendre précisément quelles informations Google Trends donnait1. L’encadré suivant explique l’algorithme utilisé.

Pour garantir l’anonymat des utilisateurs, quand nous utilisons Google Trends, ce que nous obtenons n’est pas le nombre total de recherches sur un certain mot, mais un indice normalisé du nombre de recherches :

Par exemple, pour un mot clé unique examiné sur une période d’un an dans une certaine région, Google Trends commence par déterminer pour chaque semaine son taux de popularité. Le taux de popularité indique le nombre de recherches du mot clé sur le nombre total de recherches. Ce taux est ensuite normalisé de façon proportionnelle de sorte que 100 correspond au taux de popularité du mot clé le plus élevé durant l’année étudiée. Ainsi, un indice normalisé de 50 signifie que le mot clé a été recherché moitié moins que dans la semaine où il était de 100. Les indices normalisés permettent alors de mesurer l’évolution du nombre de recherche du mot clé dans le temps, de comparer sa popularité dans plusieurs régions du monde ou de comparer la popularité de plusieurs mots clés.

Une fois clarifié le type d’informations que Google Trends fournissait, j’ai commencé à chercher des mots clés relatifs aux mouvements sociaux comme « cambio » (« changement » en espagnol). Je l’ai cherché en Espagne entre avril 2011 et janvier 2012. Comme il y a eu un mouvement social très important en mai 2011 dans ce pays – « mouvement du 15-M » ou « mouvement des Indignés » –, je m’attendais à voir apparaître un pic ou un changement dans la tendance aux alentours de cette période (voir Fig. 2).

Le graphique montre l’évolution de la popularité du mot « cambio » (« changement » en espagnol) dans les recherches Google entre avril 2011 et janvier 2012. Un pic peut-être observé en novembre 2011.
Figure 2. Source: Élaboré par l’auteur à partir de données fournies par Google Trends.

De manière assez surprenante, je n’ai pas trouvé clairement de changement radical dans la tendance autour de mai 2011 ; à la place il y avait un pic à la fin d’octobre de la même année. Immédiatement, j’ai cherché à savoir ce qu’il s’était passé en Espagne en octobre 2011 et je n’ai rien trouvé de pertinent. Et puis, j’ai essayé de voir l’évolution des recherches de « cambio » (« changement ») sur une plus longue période, entre 2010 et 2015 (voir Fig. 3).

Description : Le graphique montre l’évolution de l’indice de popularité pour le mot « cambio » (« changement ») dans les recherches Google entre janvier 2010 et avril 2015. Des pics périodiques peuvent être observés à la fin des mois de mars et d’octobre de chaque année.
Figure 3. Source: Élaboré par l’auteur à partir de données fournies par Google Trends.

On peut clairement voir qu’il y a des pics à la fin des mois d’octobre et de mars correspondant aux changements d’heures d’été et d’hiver qui ont lieu en en Espagne chaque année respectivement aux mois d’octobre et de mars.

J’ai alors essayé avec un mot avec une signification équivalente, mais moins ambiguë : « alternativa » (« alternative » en espagnol). Les résultats apparaissent Fig. 4.

Le graphique montre l’évolution de l’indice de popularité pour le mot « alternativa » (« alternative ») dans les recherches Google entre janvier 2010 et avril 2015. Un pic est clairement visible en mai 2011. D’autres pics sont présents.
Figure 4. Source: Élaboré par l’auteur à partir de données fournies par Google Trends.

Maintenant, nous voyons clairement un pic en mai 2011. Nous voyons qu’il y a moins de motifs saisonniers que pour « cambio » (« changement »). Ce simple exercice montre pourquoi il faut faire particulièrement attention quand on est confronté à des données brutes. L’information donnée par Google Trends est un bel outil puissant, mais elle doit être utilisée avec précaution sans quoi elle peut mener à des incompréhensions ou même de fausses conclusions.

Google est devenu un très bon oracle qui ne dit pas uniquement une infinité de choses sur le monde qui nous entoure, mais qui peut nous montrer bien des aspects de nous-mêmes. Nous devons faire attention aux questions que nous posons ; nous devons, comme avec les bons oracles, les authentiques, choisir nos questions avec sagesse.

Références

  • Choi, H., & Varian, H. (2012). Predicting the present with Google Trends. Economic Record, 88(s1), 2-9.
  • Ingram, D. G., Matthews, C. K., & Plante, D. T. (2014). Seasonal trends in sleep-disordered breathing: evidence from Internet search engine query data. Sleep and Breathing, 1-6.
  • Preis, T., Moat, H. S., & Stanley, H. E. (2013). Quantifying trading behavior in financial markets using Google Trends. Scientific reports, 3.
  • Rossignol, L., Pelat, C., Lambert, B., Flahault, A., Chartier-Kastler, E., & Hanslik, T. (2013). A Method to Assess Seasonality of Urinary Tract Infections Based on Medication Sales and Google Trends. PLoS ONE, 8(10), e76020. doi:10.1371/journal.pone.0076020

Notes


  1. Dans l’explication de l’index qui suit, je présente seulement le cas où l’on s’intéresse à un unique mot clé.