Microsoft Clarity affiche désormais les requêtes de base derrière les citations de l’IA

Lorsque Microsoft Clarity a rendu les citations IA accessibles à tous les utilisateurs, cela a ouvert un nouveau terrain de jeu permettant aux référenceurs de récolter des données de visibilité IA. Enfin, nous pouvons voir les « requêtes de base » exactes qu’un moteur d’IA utilise pour extraire notre contenu.

Cela soulève une énorme question car il s’agit d’un outil Microsoft : les informations sont-elles inutiles si votre public ne touche pas l’écosystème Bing ?

Requêtes de mise à la terre Microsoft Clarity

Lorsque vous posez une question à Copilot, il traduit vos mots en termes de recherche simples appelés requêtes de base pour trouver des faits sur le Web avant de répondre. Vous pouvez utiliser ces données pour améliorer votre propre site Web et votre contenu.

  • Trouver les lacunes où votre contenu ne correspond pas à ce que recherche l’IA.
  • Simplifier les pages que l’IA lit mais vers lesquelles aucun lien n’est établi.
  • Utiliser ces mises en page simples pour améliorer vos résultats de recherche Google.

Copilote contre. Gémeaux

Copilot et Gemini utilisent tous deux des approches de récupération augmentée. Au lieu de générer des réponses en utilisant uniquement des paramètres pré-entraînés, ils interrogent dynamiquement des index de recherche externes pour récupérer des données en temps réel, qu’ils utilisent ensuite comme contexte pour étayer leurs réponses finales.

Fonctionnalité Copilote Microsoft Google Gémeaux
Structure Utilise un traducteur de requêtes, une recherche d’index Bing et des modèles OpenAI pour rédiger le texte final. Utilise un traducteur de requêtes, la recherche Google et les modèles Gemini de Google pour rédiger le texte final.
Extraire les sources Utilise l’index Bing et Microsoft Graph pour analyser les pages Web, les e-mails et les fichiers Microsoft 365. (Avec les autorisations activées) Utilise la recherche Google et Google Workspace pour analyser les pages Web, les fichiers Google Drive et Gmail. (Avec les autorisations activées)
Synthèse des réponses Se concentre sur les réponses directes. Il utilise des listes structurées, des tableaux et des puces pour afficher rapidement les faits. Se concentre sur des réponses créatives et conversationnelles. Il est conçu pour gérer simultanément du texte, des images et du code.

Le classement dans Bing est-il important ?

Oui (Corrélation).

L’un de mes sites Web fonctionnait extrêmement bien dans Copilot, avec plus de 36 000 citations pour toutes les requêtes. Désormais, Clarity ne vous donne pas les invites/requêtes elles-mêmes, mais il vous donne les requêtes Grounding (requêtes de base et expressions clés utilisées pour récupérer le contenu de votre site).

Mon site Web a une histoire qui dure depuis des années avec un domaine précédent fusionné en 2019 et compte plus de 1 000 articles. Étant donné que Google envoie à peine du trafic et que les outils de référencement tiers le qualifient souvent de spam en raison de backlinks non anglais (il couvre les moteurs de recherche comme Baidu, CocCoc, SwissCows, attirant un public international), je ne m’attendais pas à 36 000 citations.

Alors, pourquoi le copilote aime-t-il ? J’ai répondu aux 147 requêtes de base et suivi leur classement dans Google et Bing.

Sur les 147 requêtes, Bing les a toutes classées sauf 6, la majorité dans des positions génératrices de trafic (top 20). Google n’en a classé aucun.

Donc, si cela dépend fortement de l’indexation Bing, les données de Clarity sont-elles utiles en dehors de l’écosystème Bing/Microsoft ?

Puisqu’il s’agit d’un outil Microsoft, les données backend alimentant ce tableau de bord capturent principalement la façon dont votre site est cité sur les surfaces d’IA de Microsoft (comme la recherche générative Copilot et Bing).

Cela ne vous donne pas une fenêtre directe sur la façon dont ChatGPT d’OpenAI (en utilisant sa propre recherche), Google Gemini ou Perplexity citent vos liens, car ces plates-formes ne partagent pas leurs journaux de mise à la terre internes avec Microsoft.

Et historiquement, en tant qu’industrie, nous avons négligé Bing.

Même si la source de collecte de données est orientée vers le moteur d’IA de Microsoft, les informations elles-mêmes sont hautement transférables à vos stratégies d’optimisation d’IA plus larges et indépendantes de la plate-forme.

Pouvons-nous supposer que d’autres LLM récupèrent des données de la même manière ?

Les moteurs d’IA, qu’il s’agisse de Google Gemini ou de Microsoft Copilot, utilisent des frameworks RAG similaires pour récupérer des données.

Si l’écosystème Bing signale qu’une page spécifique de votre site a une « part d’autorité » élevée pour une requête complexe, cela signifie que cette page est parfaitement structurée pour la consommation de l’IA (tableaux clairs, puces, réponses directes). Les données suggèrent que vous pouvez reproduire ce formatage sur votre site pour attirer également Google Gemini.

Cependant, cela peut être contesté, car d’autres recherches suggèrent que la similarité entre les LLM dépend de biais de position, et certains peuvent utiliser la méthode SDSR plutôt que RAG.

Les chercheurs en référencement ont également découvert que ChatGPT a commencé à utiliser la recherche Google comme solution de repli, alors qu’il s’agissait initialement de Bing.

En résumé

Si votre public ne touche pas à l’écosystème Microsoft, ce tableau de bord ne vous donnera pas un reflet parfait de votre trafic total d’IA, mais il ne rend pas les données inutiles.

Ce que révèlent les requêtes fondamentales, c’est la façon dont les systèmes d’IA distillent l’intention de l’utilisateur en termes de recherche récupérables. Ce processus est globalement cohérent sur toutes les plateformes, même lorsque les indices sous-jacents diffèrent. Une page qui reçoit des citations dans Copilot fait quelque chose de bien structurellement avec des réponses claires, des sujets bien ciblés et un contenu aligné sur la façon dont les moteurs d’IA traduisent les questions en requêtes. La dépendance Bing vous indique d’où proviennent les données. Les modèles structurels vous disent quelque chose de plus transférable.

Les données sur les écarts sont tout aussi instructives. Pages pour lesquelles votre site est classé dans Bing et qui n’apparaissent jamais, car les requêtes de base signalent une inadéquation. Soit le contenu n’est pas structuré pour la récupération par l’IA, soit le sujet n’est pas celui sur lequel les moteurs d’IA fondent activement les réponses.

Traitez le tableau de bord Citations de Clarity comme un proxy utile ou un « environnement de laboratoire » et découvrez comment les LLM lisent, découpent et créditent le contenu de votre site Web. Même si Copilot n’est pas votre principale source de trafic IA, les modèles qu’il révèle méritent qu’on y prête attention.

Plus de ressources :