Les données de la CGC sont incomplètes à 75 %

Améliorez vos compétences grâce aux informations hebdomadaires d’experts de Growth Memo. Abonnez-vous gratuitement !

Mes résultats cette semaine montrent que les données de la Google Search Console sont incomplètes à environ 75 %, ce qui rend les décisions GSC provenant d’une source unique dangereusement peu fiables.

1. GSC était autrefois une vérité terrain

Les données de la Search Console étaient autrefois la représentation la plus précise de ce qui se passe dans les résultats de recherche. Mais l’échantillonnage de confidentialité, les impressions gonflées par les robots et la distorsion de l’IA Overview (AIO) nuisent à la fiabilité des données.

Sans comprendre comment vos données sont filtrées et faussées, vous risquez de tirer de fausses conclusions à partir des données GSC.

Les données de référencement sont sur un long chemin pour devenir moins fiables, à commencer par la suppression par Google du mot-clé référent jusqu’à l’exclusion des fonctionnalités SERP critiques des résultats de performances. Mais trois événements clés au cours des 12 derniers mois sont venus couronner le tout :

  • Janvier 2025 : Google déploie « SearchGuard », nécessitant JavaScript et CAPTCHA (sophistiqué) pour quiconque consulte les résultats de recherche (il s’avère que Google utilise de nombreux signaux avancés pour différencier les humains des scrapers).
  • Mars 2025 : Google augmente considérablement le nombre d’aperçus d’IA dans les SERP. Nous constatons une augmentation significative des impressions et une baisse des clics.
  • Septembre 2025 : Google supprime le paramètre num=100, que les scrapers SERP utilisent pour analyser les résultats de recherche. Le pic d’impressions se normalise, les clics restent faibles.

D’une part, Google a pris des mesures pour nettoyer les données GSC. D’un autre côté, les données nous laissent encore plus de questions ouvertes que de réponses.

2. L’échantillonnage de confidentialité masque 75 % des requêtes

Google filtre un nombre important d’impressions (et de clics) pour des raisons de « confidentialité ». Il y a un an, Patrick Stox analysait un vaste ensemble de données et arrivait à la conclusion que près de 50 % étaient filtrées.

J’ai répété l’analyse (10 sites en B2B hors des USA) sur ~4 millions de clics et ~450 millions d’impressions.

Méthodologie:

  • Google Search Console (GSC) fournit des données via deux points de terminaison d’API qui révèlent son comportement de filtrage. La requête globale (sans dimension) renvoie le nombre total de clics et d’impressions, y compris toutes les données. La requête au niveau de la requête (avec la dimension « requête ») renvoie uniquement les requêtes répondant au seuil de confidentialité de Google.
  • En comparant ces deux nombres, vous pouvez calculer le taux de filtrage.
  • Par exemple, si les données agrégées affichent 4 205 clics mais que les données au niveau de la requête n’affichent que 1 937 clics visibles, Google a filtré 2 268 clics (53,94 %).
  • J’ai analysé 10 sites SaaS B2B (~ 4 millions de clics, ~ 450 millions d’impressions), en comparant des périodes de 30 jours, 90 jours et 12 mois à la même analyse de 12 mois auparavant.

Ma conclusion :

1. Google filtre environ 75 % des impressions.

  • Le taux de filtrage des impressions est incroyablement élevé, les trois quarts étant filtrés pour des raisons de confidentialité.
  • Il y a 12 mois, ce taux n’était que de 2 points de pourcentage plus élevé.
  • La fourchette que j’ai observée allait de 59,3 % à 93,6 %.

2. Google filtre environ 38 % des clics, mais environ 5 % de moins qu’il y a 12 mois.

  • Le filtrage des clics n’est pas quelque chose dont nous parlons beaucoup, mais il semble que Google ne signale pas jusqu’à un tiers de tous les clics effectués.
  • Il y a 12 mois, Google filtrait plus de 40 % des clics.
  • La plage de filtrage s’étend de 6,7% à 88,5% !

La bonne nouvelle est que le taux de filtrage a légèrement diminué au cours des 12 derniers mois, probablement en raison d’une diminution du nombre d’« impressions de robots ».

La mauvaise nouvelle : le problème principal persiste. Même avec ces améliorations, 38 % de filtrage des clics et 75 % de filtrage des impressions restent catastrophiquement élevés. Une amélioration de 5 % ne garantit pas la fiabilité des décisions GSC provenant d’une source unique lorsque les trois quarts de vos données d’impression sont manquantes.

3. Les impressions de 2025 sont fortement gonflées

Les 12 derniers mois ont été marqués par des montagnes russes de données GSC :

  • En mars 2025, Google a intensifié le déploiement des AIO et a affiché 58 % de plus pour les sites que j’ai analysés.
  • En juillet, les impressions ont augmenté de 25,3 % et de 54,6 % supplémentaires en août. Les scrapers SERP ont trouvé un moyen de contourner SearchGuard (le « bot » de protection que Google utilise pour empêcher les scrapers SERP) et ont provoqué la capture des « impressions de robots » par les AIO.
  • En septembre, Google a supprimé le paramètre num=100, ce qui a entraîné une baisse des impressions de 30,6 %.

Avance rapide jusqu’à aujourd’hui :

  • Les clics ont diminué de 56,6 % depuis mars 2025.
  • Impressions normalisées (en baisse de -9,2 %).
  • AIO réduits de 31,3%.

Je ne parviens pas à déterminer un nombre causal de clics réduits provenant des AIO, mais la corrélation est forte : 0,608. Nous savons que les AIO réduisent les clics (ce qui est logique), mais nous ne savons pas exactement dans quelle mesure. Pour comprendre cela, je devrais mesurer le CTR des requêtes avant et après l’apparition d’un AIO.

Mais comment savoir si la baisse des clics est due à un AIO et pas seulement à une mauvaise qualité du contenu ou à une dégradation du contenu ?

Recherchez la corrélation temporelle :

  • Suivez la chute de vos clics par rapport au calendrier de déploiement d’AIO de Google (pic de mars 2025). La mauvaise qualité du contenu montre un déclin progressif ; L’impact d’AIO est précis et spécifique aux requêtes.
  • Croisement avec les données de position. Si les classements restent stables alors que les clics diminuent, cela signale une cannibalisation AIO. Vérifiez si les requêtes concernées sont informatives (à tendance AIO) ou transactionnelles (résistantes à AIO). Votre coefficient de corrélation de 0,608 entre la présence AIO et la réduction des clics soutient cette approche diagnostique.

4. Les impressions de robots augmentent

J’ai des raisons de croire que les scrapers SERP reviennent. Nous pouvons mesurer le nombre d’impressions probablement causées par les robots en filtrant les données GSC par requêtes contenant plus de 10 mots et deux impressions. La probabilité qu’une requête (invite) aussi longue soit utilisée deux fois par un humain est proche de zéro.

La logique des impressions de bot :

  • Hypothèse: Les humains recherchent rarement deux fois exactement la même requête de plus de 5 mots dans une courte fenêtre.
  • Filtre: Identifiez les requêtes contenant plus de 10 mots qui génèrent > 1 impression mais aucun clic.
  • Mise en garde: Cette méthode peut capturer certaines requêtes légitimes sans clic, mais fournit une estimation directionnelle de l’activité du robot.

J’ai comparé ces requêtes au cours des 30, 90 et 180 derniers jours :

  • Les requêtes avec +10 mots et +1 impression ont augmenté de 25 % au cours des 180 derniers jours.
  • La plage d’impressions de robots s’étend de 0,2 % à 6,5 % (30 derniers jours).

Voici ce que vous pouvez anticiper comme pourcentage « normal » d’impressions de robots pour un site SaaS typique :

  • Sur la base de l’ensemble de données B2B de 10 sites, les impressions de robots varient de 0,2 % à 6,5 % sur 30 jours, avec des requêtes contenant plus de 10 mots et plus de 2 impressions mais 0 clic.
  • Pour le SaaS en particulier, attendez-vous à une base de référence de 1 à 3 % pour les impressions de robots. Les sites proposant une documentation complète, des guides techniques ou des pages de référencement programmatique ont tendance à augmenter (4 à 6 %).
  • La croissance de 25 % sur 180 jours suggère que les scrapers s’adaptent après SearchGuard. Surveillez votre position centile dans cette plage plus que le nombre absolu.

Les impressions des robots n’affectent pas votre classement réel, mais uniquement vos rapports en gonflant le nombre d’impressions. L’impact pratique ? Ressources mal allouées si vous optimisez les requêtes d’impression gonflées que les humains ne recherchent jamais.

5. La couche de mesure est cassée

Les décisions d’une source unique basées uniquement sur les données de GSC deviennent dangereuses :

  • Les trois quarts des impressions sont filtrées.
  • Les impressions de robots génèrent jusqu’à 6,5 % des données.
  • Les AIO réduisent les clics de plus de 50 %.
  • Le comportement des utilisateurs change structurellement.

Votre opportunité réside dans la méthodologie : les équipes qui construisent des cadres de mesure robustes (scripts de taux d’échantillonnage, calculs de partage de robots, triangulation multi-sources) disposent d’un avantage concurrentiel.