Une discussion intéressante a émergé sur Twitter inspirée par un article écrit par Jono Alderson. L’article propose de réfléchir au balisage des données structurées de Schema.org comme moyen pour les technologies émergentes d’IA de mieux comprendre et faire apparaître le contenu Internet publié.
Balisage des données structurées Schema.org
Le contenu d’un site Web est appelé données non structurées car il n’existe aucune structure formelle organisée qui étiquette chaque partie du contenu de manière lisible par machine. Les données structurées, en revanche, sont exactement le même contenu, mais organisées avec des étiquettes qui identifient les images, les auteurs et le contenu afin qu'une machine puisse les comprendre immédiatement.
Le balisage de données structurées Schema.org est généralement considéré par les éditeurs et la communauté SEO comme quelque chose à utiliser pour rendre une page Web éligible aux fonctionnalités de résultats enrichis de Google. Cette façon de penser se manifeste dans les nombreux plugins WordPress SEO et Schema.org qui se limitent à produire des données structurées que Google peut utiliser pour faire apparaître des résultats riches.
De nouvelles technologies d'IA capables d'utiliser des données structurées sont arrivées, obligeant les spécialistes du marketing de recherche à envisager une nouvelle approche de la manière dont les données structurées sont déployées. Ce que Jono encourage dans l'article, c'est de considérer les données structurées comme un moyen de créer une « fondation axée sur les données » prête pour un avenir proche.
L'article propose de considérer le balisage Schema.org comme un moyen de communiquer en quoi consiste une page Web et comment elle se rapporte à tout le reste du site Web. Jono écrit :
« Mais n'hésitez pas à créer un graphique connecté d'un schéma plus large et « descriptif » simplement parce que Google ne montre pas de retour immédiat. Ces types et relations « descriptifs » pourraient finir par être la bouée de sauvetage entre votre contenu et les modèles d’IA du futur.
Jono a tweeté à propos de son article sur X (anciennement Twitter) et Martha van Berkel, fondatrice de SchemaApp, était d'accord avec l'article de Jono selon lequel le rôle du balisage des données structurées Schema est en train de changer.
Elle a tweeté :
« Je suis d'accord avec vous sur le fait que le rôle du balisage de schéma est en train de changer. Construire un graphique de connaissances pour gérer la façon dont votre site Web/contenu est compris avec un schéma, puis lui poser des questions sera plus important que l'optimisation pour les résultats enrichis ou pour Google.
Ammon Johns a tweeté :
« Le plus gros problème avec Schema est qu’il s’agit en grande partie d’une simple auto-déclaration, qui n’est pas différente du contenu META, et nous savons à quel point Google a décidé que ce contenu était fiable. Google l’utilisera donc, mais il est peu probable qu’il lui fasse pleinement confiance.
Ammon a bien sûr raison : on ne peut pas faire aveuglément confiance aux données structurées. Une façon de résoudre ce problème consiste à utiliser un index plus petit de sites Web de haute qualité, comme le fait Perplexity AI.
Gagan Ghotra a tweeté comment ils aimeraient parfois étendre leur utilisation des données structurées, mais sont limités par ce qu'offrent les outils de référencement et de données structurées.
Lisez la discussion X de Jono Alderson ici.
Lisez l'article de Jono :
Et si Schema.org n'était que… des étiquettes ?