Ce que révèle le dernier rapport Web Almanac sur les robots, l'influence du CMS et llms.txt

Le Web Almanac est un rapport annuel qui traduit l’ensemble de données HTTP Archive en informations pratiques, combinant des mesures à grande échelle avec l’interprétation experte d’experts du secteur.

Pour avoir un aperçu de ce que le rapport 2025 peut nous dire sur ce qui se passe réellement en matière de référencement, j’ai parlé avec l’un des auteurs de la mise à jour du chapitre SEO, Chris Green, un expert bien connu du secteur avec plus de 15 ans d’expérience.

Chris a partagé avec moi quelques surprises concernant l’adoption des fichiers llms.txt et la façon dont les systèmes CMS façonnent le référencement bien plus que nous ne le pensons. Des faits peu connus que les données ont fait surface dans la recherche et des informations surprenantes qui passeraient généralement inaperçues.

Vous pouvez regarder l’interview complète de Chris sur l’enregistrement à mon humble avis à la fin, ou continuer à lire le résumé de l’article.

« Je pense que les données [in the Web Almanac] m’a aidé à me montrer qu’il y avait encore beaucoup de choses cassées. Le Web est vraiment compliqué. Vraiment compliqué.

La gestion des robots n’est plus « Google ou pas Google ? »

Bien que la gestion des robots soit depuis un certain temps binaire – autoriser/interdire Google – elle devient un nouveau défi. Quelque chose qu’Eoghan Henn avait découvert auparavant et que Chris avait découvert dans ses recherches.

Nous avons commencé notre conversation en discutant de la manière dont les fichiers des robots sont désormais utilisés pour exprimer leur intention concernant l’accès des robots d’exploration IA.

Chris a répondu en disant que, premièrement, il est nécessaire d’être conscient des différents robots, de leurs intentions et, fondamentalement, de ce que leur blocage pourrait faire, c’est-à-dire que le blocage de certains robots a des implications plus importantes que d’autres.

Deuxièmement, les fournisseurs de plates-formes doivent réellement écouter ces règles et traiter ces fichiers de manière appropriée. Cela ne se produit pas toujours, et l’éthique autour des robots et des robots d’exploration de l’IA est un domaine que les référenceurs doivent connaître et mieux comprendre.

Chris a expliqué que bien que le rapport Almanac ait montré le symptôme de l’utilisation de robots.txt, les référenceurs doivent aller de l’avant et comprendre comment contrôler les robots.

« Il ne s’agit pas seulement de comprendre quel est l’impact de chaque [bot/crawler] est, mais aussi comment communiquer cela avec l’entreprise. Si vous avez une équipe qui souhaite réduire autant que possible l’exploration des robots parce qu’elle veut économiser de l’argent, cela pourrait avoir un impact désespéré sur la visibilité de votre IA.

De même, vous pourriez avoir une équipe éditoriale qui ne souhaite pas que tout son travail soit supprimé et régurgité. Ainsi, en tant que référenceurs, nous devons comprendre cette dynamique, comment la contrôler techniquement, mais également comment faire valoir cet argument dans l’entreprise. Chris a expliqué.

À mesure que de plus en plus de plates-formes et de robots d’exploration seront introduits, les équipes SEO devront considérer toutes les implications et collaborer avec d’autres équipes pour garantir que le bon équilibre d’accès est appliqué au site.

Llms.txt est appliqué malgré l’absence d’adoption officielle de la plate-forme

La première conclusion surprenante du rapport est que l’adoption de la norme llms.txt proposée concerne environ 2 % des sites de l’ensemble de données.

Llms.txt a été un sujet brûlant dans l’industrie, de nombreux référenceurs rejetant la valeur du fichier. Certains outils, tels que Yoast, incluent la norme, mais jusqu’à présent, il n’y a eu aucune démonstration de son adoption réelle par les fournisseurs d’IA.

Chris a admis que 2 % représentait une adoption plus élevée que prévu. Mais une grande partie de cette croissance semble être due aux outils de référencement qui ont ajouté llms.txt comme fonctionnalité par défaut ou facultative.

Chris est sceptique quant à son impact à long terme. Comme il l’a expliqué, Google a déclaré à plusieurs reprises qu’il n’envisageait pas d’utiliser llms.txt, et sans un engagement clair de la part des principaux fournisseurs d’IA, en particulier d’OpenAI, il risque de rester un geste symbolique de niche plutôt qu’un standard fonctionnel.

Cela dit, Chris a rencontré des données de fichiers journaux suggérant que certains robots d’exploration IA récupèrent déjà ces fichiers et, dans des cas limités, ils peuvent même être référencés comme sources. Green considère cela moins comme un avantage concurrentiel que comme un mécanisme de parité potentiel, quelque chose qui peut aider certains sites à être compris, mais sans les élever de manière spectaculaire.

« Google a déclaré à maintes reprises qu’il n’avait pas l’intention d’utiliser llms.txt, ce qu’il a réitéré à Zurich lors du Search Central l’année dernière. Je pense que, fondamentalement, Google n’en a pas besoin car ils ont maîtrisé l’exploration et le rendu. Donc, je pense que cela dépend de la décision d’OpenAI de l’utiliser ou non et je pense qu’ils ont d’autres problèmes que d’essayer de mettre en place une nouvelle norme. «

Différent, mais rassurant, le même là où cela compte

J’ai ensuite demandé à Chris comment les référenceurs pouvaient équilibrer la différence entre la visibilité des moteurs de recherche et la visibilité des machines.

Il pense qu’il y a « un chevauchement important entre ce qu’était le référencement avant que nous commencions à nous en préoccuper et où nous en sommes au début de 2026 ».

Malgré ce chevauchement, Chris a clairement indiqué que si quelqu’un pense que l’optimisation pour la recherche et les machines est la même, alors il n’est pas conscient des deux systèmes différents, des pondérations différentes, du fait que l’interprétation, la récupération et la génération sont complètement différentes.

Bien qu’il existe différents systèmes et différentes capacités en jeu, il ne pense pas que le référencement ait fondamentalement changé. Sa conviction est que l’optimisation du référencement et de l’IA est « un peu la même chose, de manière rassurante, la même dans les endroits importants, mais vous devrez l’aborder différemment » car elles divergent dans la manière dont les résultats sont livrés et consommés.

Chris a dit que les référenceurs s’orienteront davantage vers les flux, la gestion des flux et l’optimisation des flux.

« Le protocole commercial universel de Google, qui permet d’effectuer des transactions directement à partir des résultats de recherche ou d’une fenêtre Gemini, change évidemment beaucoup. C’est juste une autre mesure visant à sortir le site Web de la boucle. Mais les informations que nous optimisons réellement doivent encore être optimisées. C’est juste dans un endroit différent. «

Les plates-formes CMS façonnent le Web plus que les référenceurs ne le pensent

La plus grande surprise du Web Almanac 2025 a peut-être été l’ampleur de l’influence exercée par les plateformes CMS et les fournisseurs d’outils.

Chris a déclaré qu’il n’avait pas réalisé à quel point cet impact était important. « Les plateformes comme Shopify, Wix, etc. façonnent l’état actuel du référencement technologique probablement plus profondément que je ne pense que beaucoup de gens le croient vraiment. »

Chris a poursuivi en expliquant que « aussi bien intentionnés que soient les référenceurs individuels, je pense que notre impact global sur le Web est minime en dehors des fournisseurs de plates-formes CMS. Je dirais que si vous êtes vraiment déterminé à avoir un impact en dehors de vos clients spécifiques, vous devez encourager WordPress, Wix ou Shopify ou certains des grands fournisseurs de logiciels au sein de ces écosystèmes. «

Cela crée des opportunités : les sites Web qui mettent en œuvre correctement les normes techniques pourraient se différencier considérablement alors que la plupart des sites sont à la traîne des meilleures pratiques.

L’un des enseignements les plus intéressants de cette conversation est que tant de choses sur le Web sont brisées et le peu d’impact que nous avons sur le Web. [SEOs] vraiment.

Chris a expliqué que « beaucoup de référenceurs pensent que Google nous doit parce que nous entretenons Internet pour eux. Nous faisons le sale boulot, mais je ne pense pas non plus que nous ayons autant d’impact au niveau de l’industrie que certains aiment peut-être le croire. Je pense que les données du Web Almanac m’ont en quelque sorte aidé à me montrer qu’il y a encore beaucoup de choses cassées. Le Web est vraiment en désordre. Vraiment en désordre. «

Les agents IA ne remplaceront pas les référenceurs, mais ils remplaceront les mauvais processus

Notre conversation s’est terminée avec les agents IA et l’automatisation. Chris a commencé par dire : « Les agents sont facilement mal compris parce que nous utilisons le terme différemment. »

Il a souligné que les agents ne remplacent pas l’expertise, mais bien des accélérateurs de processus. La plupart des flux de travail SEO impliquent une collecte de données répétitive et une reconnaissance de formes, des domaines bien adaptés à l’automatisation. La valeur de l’expertise humaine réside dans la conception des processus, l’application du jugement et la contextualisation des résultats.

Les agents débutants pourraient automatiser 60 à 80 % du travail, à l’instar d’un stagiaire hautement compétent. « Il faudra vos connaissances et votre expertise pour rendre cela applicable à votre contexte donné. Et je ne parle pas seulement du contexte du marketing Web ou du contexte du commerce électronique. Je veux dire du contexte de l’entreprise pour laquelle vous travaillez spécifiquement », a-t-il déclaré.

Chris dirait que de nombreux référenceurs ne consacrent pas suffisamment de temps à personnaliser ce qu’ils font spécifiquement pour le client. Il pense qu’il existe une opportunité de créer un processus automatisé à 80 %, puis d’ajouter votre réelle valeur lorsque votre intervention humaine optimise les derniers 20 % de logique métier.

Les référenceurs qui interagissent avec les agents, affinent les flux de travail et évoluent parallèlement à l’automatisation sont beaucoup plus susceptibles de rester indispensables que ceux qui résistent complètement au changement.

Cependant, lors de l’expérimentation de l’automatisation, Chris a averti que nous devrions éviter d’automatiser les processus défaillants.

« Vous devez comprendre le processus que vous essayez d’optimiser. Si le processus n’est pas très bon, vous venez de créer une machine pour produire de la médiocrité à grande échelle, ce qui, franchement, n’aide personne. »

Chris pense que cela donnera un avantage aux référenceurs à mesure que l’IA sera plus largement adoptée. « Je suggère que les personnes qui s’y engageront, amélioreront ces processus et montreront comment ils peuvent évoluer continuellement, seront celles qui auront la plus grande longévité. »

Les référenceurs peuvent réussir en s’engageant dans la complexité

Le Web Almanac 2025 ne suggère pas que le référencement soit en train d’être remplacé, mais il montre que son rôle s’étend d’une manière à laquelle de nombreuses équipes ne se sont pas encore complètement adaptées. Des principes fondamentaux tels que l’exploration et l’hygiène technique sont toujours importants, mais ils existent désormais au sein d’un écosystème plus complexe façonné par les robots d’exploration d’IA, les flux, les systèmes fermés et les décisions au niveau de la plateforme.

Là où les normes techniques sont mal mises en œuvre à grande échelle, ceux qui comprennent les systèmes qui les façonnent peuvent quand même obtenir un avantage significatif.

L’automatisation fonctionne mieux lorsqu’elle accélère des processus bien conçus et échoue lorsqu’elle se contente de réduire l’inefficacité. Les référenceurs qui se concentrent sur la conception des processus, le jugement et le contexte commercial resteront essentiels à mesure que l’automatisation deviendra plus courante.

Dans un Web de plus en plus désordonné et piloté par les machines, les référenceurs qui réussiront seront ceux prêts à s’attaquer à cette complexité plutôt que de l’ignorer.

Le référencement en 2026 ne consiste pas à choisir entre la recherche et l’IA ; il s’agit de comprendre comment plusieurs systèmes consomment le contenu et où se produit désormais l’optimisation.

Regardez l’interview vidéo complète de Chris Green ici :

Merci à Chris Green d’avoir offert ses idées et d’avoir été mon invité sur IMHO.

Plus de ressources :

Ce que révèle le dernier rapport Web Almanac sur les robots, l’influence du CMS et llms.txt