Proposition controversée visant à étiqueter les sections du contenu généré par l’IA
Une nouvelle proposition a été publiée pour créer un attribut HTML qui peut être utile pour indiquer aux robots d’exploration quelle partie d’une page Web est générée par l’IA. La proposition devient rapidement pertinente en raison de l’entrée en vigueur de nouvelles règles en Europe cet été, mais certains se demandent si c’est la bonne solution à ce problème.
Divulgation de l’IA
La proposition a été créée par David E. Weekly (profil LinkedIn), qui a noté qu’il existe actuellement des propositions qui fournissent un signal plus général selon lequel une page Web entière est générée par l’IA, mais rien qui étiquette uniquement une section d’une page Web dans une page qui est par ailleurs créée par un humain.
La proposition de Weekly reconnaît la réalité selon laquelle de nombreuses pages Web sont partiellement générées par l’IA. Un exemple est celui des résumés de contenu d’actualité générés par l’IA. La proposition mentionne spécifiquement les sites d’actualités qui contiennent une barre latérale avec des résumés générés par l’IA.
La proposition suggère de créer un attribut HTML pouvant être appliqué au niveau de la section à l’aide de l’attribut
Weekly explique comment il résout un problème :
« Une page d’article d’actualité peut contenir une enquête écrite par un humain ainsi qu’une barre latérale de résumé générée par l’IA. Les approches existantes ne prennent en charge que la divulgation au niveau de la page (le balise proposée dans whatwg/html#9479) ou des signaux de niveau réponse HTTP (IETF draft-abaris-aicdh-00). Ni l’un ni l’autre ne permet de marquer des sections individuelles d’une page, ce que plus de 42 commentateurs sur le problème WHATWG ont identifié comme la principale fonctionnalité manquante.
L’article 50 de la loi européenne sur l’IA (en vigueur en août 2026) exige un marquage lisible par machine du contenu textuel généré par l’IA, créant ainsi une demande réglementaire pour exactement ce type de norme.
L’élément de côté
Le
La définition du
est:
« Le
Donc l’utilisation du
Alors, est-ce une solution imparfaite dans le contexte d’un résumé généré par l’IA et directement lié au contenu principal du document ? Je pense que c’est possible. Personne dans la discussion sur GitHub n’évoque cette déconnexion évidente dans l’utilisation du
La règle fondamentale du
Pas une proposition réglée
Une conversation animée est en cours dans le référentiel GitHub concernant la proposition. L’un des objectifs du
Ils ont écrit :
« J’ai examiné la proposition et les discussions qui l’ont entourée, y compris les arguments pour et contre. Cependant, plus je lis, plus j’ai d’incertitude quant à la nécessité pratique d’introduire un balisage supplémentaire au niveau de la plateforme. Pour le moment, cette approche semble principalement destinée à satisfaire des exigences formelles ou réglementaires, sans aucun bénéfice clairement démontré pour l’écosystème du Web dans son ensemble. »
Ce qu’il faut retenir, c’est que l’intervenant considère la proposition comme un balisage axé sur la conformité que les plateformes seraient censées ajouter même si cela n’améliore pas clairement le Web lui-même, et cette préoccupation devient plus aiguë si la mise en œuvre pousse la divulgation dans des éléments HTML sémantiques existants comme
Théophile
Théophile, rédacteur chez Smart Ranking, est une figure incontournable dans le décryptage des mystères de l'algorithme de Google. Armé d'une expertise approfondie en SEO et d'une passion pour l'optimisation web, il guide les propriétaires de sites à travers les jungles du référencement avec aisance. Ses articles, à la fois informatifs et accessibles, font de lui une ressource précieuse pour quiconque cherche à propulser son site vers de nouveaux sommets.