Google affirme que LLMs.txt est purement spéculatif… pour l’instant

John Mueller de Google a répondu à une question sur la question de savoir si les conseils de Google sur LLMs.txt étaient contradictoires. Sa réponse montre pourquoi Google considère LLMs.txt comme spéculatif pour le moment et pourquoi WebMCP, une proposition soutenue par Google, pourrait être ce que les référenceurs et les propriétaires de sites devraient examiner.

LLMs.txt, Chrome Lighthouse et les conseils de Google

Une discussion sur Reddit a posé des questions sur les conseils apparemment contradictoires de Google. La personne qui a posé la question a noté que Google Search Central indique que les éditeurs n’ont pas besoin de fichiers IA spéciaux tels que LLMs.txt pour apparaître dans les expériences de recherche IA. Mais la documentation Lighthouse Audit de Chrome inclut une vérification du fichier LLMs.txt, ce qui donne l’impression d’un conflit entre les deux directives.

Le rédacteur a demandé :

« Google Search Central indique que vous n’avez pas besoin de fichiers IA spéciaux tels que LLMs.txt pour apparaître dans la recherche générative d’IA, mais les développeurs Chrome affirment que LLMs.txt peut aider les agents à comprendre la structure et le contenu principal d’un site.

Je suis anti-LLMs.txt, mais ces conseils sont-ils contradictoires de la part de Google ? Ou est-ce que je confonds « visibilité de la recherche Google » et « convivialité des agents IA » ?

Rédaction technique classique qui ne parvient pas à communiquer

La personne qui pose la question n’a apparemment pas compris ce que disait la documentation de Chrome Lighthouse Audit, car celle-ci est mal rédigée.

Contrairement à ce que croit le Redditor, la page fait pas disent que « LLMs.txt peut aider les agents à comprendre la structure et le contenu principal d’un site. »

Qu’est-ce que c’est fait dire, c’est que LLMS.txt est une « convention émergente » et que sans ce fichier les agents IA »peut passez plus de temps à explorer le site pour comprendre sa structure de haut niveau et son contenu principal. Ce mot « peut» fait beaucoup de travail parce que c’est un mot caché qui communique une possibilité, pas une certitude.

  • Le Redditor estime que les conseils de Chrome présentent un avantage.
  • Mais le libellé même ne suggère qu’une possibilité.

Les directives de Chrome Lighthouse sont du jargon car elles utilisent l’expression « convention émergente » au lieu de dire correctement que LLMS.txt n’est qu’une proposition et non une norme.

L’utilisation du mot « peut » est un mauvais choix car il oblige le lecteur à déduire que l’avantage d’un LLMs.txt est hypothétique et non quelque chose qui se produit actuellement.

La réponse ironique de Mueller

La réponse de Mueller est ironique. Il souligne que si une plateforme d’IA a besoin d’un fichier, donnez-le-lui. Aucun site d’IA ne nécessite réellement un LLMs.txt ou ne l’utilise, c’est donc purement hypothétique. L’ironie est qu’il souligne que les propriétaires de sites Web et les référenceurs utilisent des LLM pour analyser le contenu HTML afin de générer un LLMs.txt afin qu’un autre LLM n’ait pas à le faire.

Réponse de Mueller :

« Lorsqu’une plateforme d’IA qui vous apporte des clients se plaint d’avoir besoin du fichier pour votre site, alors je vous recommande de prendre le temps d’en créer un. (En plus, si vous utilisez un LLM pour créer le fichier pour vous, cela ne signifie-t-il pas que le LLM pourrait simplement… le créer pour lui-même aussi ?) »

Mueller souligne la redondance inhérente du fichier LLMs.txt.

LLMs.txt est purement spéculatif pour l’instant

Après que Mueller ait répondu à la question initiale, un autre Redditor a poursuivi la discussion en suggérant que l’avantage de la norme LLMs.txt proposée est qu’elle réduirait la quantité d’exploration et de bande passante utilisée tout en améliorant les interactions entre un site Web et les agents d’IA.

Le rédacteur a écrit :

« Ne pensez-vous pas que ce serait une bonne chose de fournir des interfaces conviviales et légères entre votre site et les LLM ? Je considère que cela est similaire à la vitesse des pages comme une bonne chose pour l’expérience utilisateur. Les LLM sont très gourmands en ressources, alors pourquoi ne pas faire ce que nous pouvons pour réduire la consommation de ressources lors de la récupération ? »

Mueller a répondu :

« Je ne pense pas que quiconque le sache – c’est purement spéculatif pour l’instant (le fichier existe depuis des années, pourtant aucun système d’IA ne l’utilise – qu’est-ce que cela signifie ?).

J’aime l’approche WebMCP, ainsi que les intégrations commerciales – elles ont des objectifs et des processus clairs : « Étant donné que l’agent est déjà sur votre site, comment peut-il *correctement* effectuer la tâche X ? (par exemple, déterminer le prix final d’un produit, y compris tous les frais et remises potentielles).

Mueller introduit un point intéressant sur WebMCP. WebMCP est une norme Web proposée qui exploite le protocole de contexte de modèle pour faire bien plus que LLMs.txt.

WebMCP permet aux agents d’IA de découvrir et d’utiliser les fonctionnalités d’un site Web, ce qui leur permet d’interagir plus facilement avec un site Web au lieu d’utiliser le code HTML créé pour les humains. Cela permet aux agents IA de comparer des produits, d’ajouter des articles à un panier et de remplir un formulaire de contact. WebMCP est actuellement pris en charge dans Chrome.

Le plus gros problème est peut-être de savoir si les sites bloquent les agents

La réponse de Mueller se poursuit par une observation supplémentaire qui constitue peut-être la partie la plus importante de la discussion. Il a suggéré que la forme la plus élémentaire d’optimisation des agents consiste simplement à s’assurer que les agents ne sont pas empêchés d’accéder à un site. Selon lui, cet obstacle pourrait être plus important pour la plupart des éditeurs que les questions concernant LLMs.txt.

Il poursuit sa réponse :

« Je ne pense pas qu’il existe l’équivalent agent de « laissez-moi regarder 10 sites et voir où je peux acheter X le plus rapidement » (les utilisateurs ne seront pas contents si l’agent achète une « FerraLamboWagen » simplement parce que c’était plus facile à acheter).

Donc, de manière spéculative, je suppose que si un agent est déjà sur votre site et chargé de faire quelque chose, il se fera un plaisir de simplement cliquer et d’essayer de terminer la tâche avec l’interface utilisateur également.

Bien entendu, tout cela suppose que l’optimisation agent la plus élémentaire soit en place, à savoir : ne pas bloquer les agents. Je pense que cet obstacle sera le plus important pour la plupart des sites.

La réalité aujourd’hui est que les agents IA peuvent utiliser l’interface utilisateur HTML conçue pour les humains. Ainsi, même si le site n’implémente pas WebMCP, l’agent peut toujours accomplir des tâches. Ce qu’il faut retenir, c’est qu’il est de plus en plus important de s’assurer que les agents IA ne sont pas bloqués.