John Mueller de Google a répondu à une question sur Reddit concernant le texte alternatif des images et le référencement, offrant une explication complète des raisons pour lesquelles le texte alternatif est important et pourquoi l'utilisation de l'IA pour créer automatiquement du texte alternatif peut être inadéquate.
Texte alternatif
La personne qui a posé la question voulait savoir si le texte alternatif était toujours pertinent pour l'optimisation des moteurs de recherche. Afin de comprendre le rôle du texte alternatif pour le référencement, il est utile de connaître la raison technique pour laquelle le texte alternatif existe.
Les éléments HTML peuvent être décrits comme les principaux éléments constitutifs d'une page Web. Les éléments peuvent être étendus avec des informations supplémentaires grâce à l'utilisation d'attributs. Par exemple, « » est un élément d'ancrage qui devient un lien avec l'attribut « href ». Un autre attribut de la l'élément d'ancrage est l'attribut nofollow.
Alt est l'abréviation de contenu alternatif ou alternatif. Alt, dans le contexte de la question, est un attribut HTML de l'élément image. Le but de « alt » est de fournir des informations alternatives sur une image qui peuvent aider un visiteur du site qui pourrait ne pas être en mesure de voir l'image et si les informations lui sont utiles dans le contexte de la page Web.
Le contenu d’une page Web est généralement considéré comme du texte, mais les images sont également du contenu lorsqu’elles ont une « valeur informative » qui aide le visiteur du site à comprendre le sujet de la page Web.
Le World Wide Web Consortium (W3C, l'organisme de normalisation HTML) offre une excellente explication :
« Choisir des alternatives textuelles appropriées :
Imaginez que vous lisez la page Web à voix haute par téléphone à quelqu'un qui a besoin de comprendre la page. Cela devrait vous aider à déterminer quelles informations (le cas échéant) ou quelle fonction les images ont. Si elles semblent n'avoir aucune valeur informative et ne sont pas des liens ou des boutons, il est probablement prudent de les considérer comme décoratives.
Les images complexes telles que les graphiques et les illustrations peuvent nécessiter un texte alternatif en deux parties, le texte alternatif fournissant une description concise du contenu de l'image et le texte environnant offrant une description plus longue et plus complète du contenu de l'image (une autre façon est de créer un lien vers la description plus longue).
En rapport: Google : le texte alternatif n'est qu'un facteur pour la recherche d'images
Question sur le texte alternatif et le référencement
La personne qui pose la question comprend que Google utilise des algorithmes complexes pour « visualiser » l’image et la comprendre et essentiellement veut savoir si l'utilisation du texte alternatif est donc redondante (répétitive) et superflue (information supplémentaire qui n'est pas nécessaire).
Voici la question posée :
« Texte alternatif d'image à l'ère de la vision par ordinateur
Les textes alternatifs des images sont-ils toujours pertinents pour le référencement avec toutes les avancées en matière de vision par ordinateur et de reconnaissance d'images ? Existe-t-il des informations selon lesquelles Google ou d'autres moteurs de recherche utilisent des modèles d'apprentissage automatique pour explorer les images plutôt que de s'appuyer sur les textes alternatifs fournis par l'utilisateur ?
Le contexte est essentiel dans le référencement
L'hypothèse émise par la personne qui pose la question est raisonnable et la question est valide. L'information qui leur manque peut être le contexte dans lequel Google utilise l'IA pour « visualiser » les images et lire le texte qu'elles contiennent. La documentation de Google montre que le contexte de ce type de vision de l'IA se trouve dans Google Lens, Google Translate et d'autres surfaces de recherche, mais la documentation de Google ne mentionne pas spécifiquement l'utilisation des capacités de vision de l'IA dans les résultats de recherche Google classiques (merci à @schachin de m'avoir indiqué cette documentation !).
La réponse de John Mueller ajoute le contexte manquant. Il explique que le contenu textuel qui entoure l'image permet de donner un contexte à l'image et à sa signification. Le simple fait d'utiliser la vision artificielle pour comprendre l'image ne permet pas de comprendre ce que cette image signifie dans le contexte de la page Web.
Voici la réponse de Mueller :
« Pour la recherche d'images, c'est le contexte issu de la combinaison page + image qui compte.
Une photo de plage peut être une affiche de détente, la plage vue depuis un hôtel, le site d'une marée noire. Le simple fait de savoir que l'image représente une plage ne donne pas suffisamment d'informations de base pour pouvoir l'afficher correctement dans une recherche d'images. Une grande partie de ces informations proviennent de la page, et le texte alternatif est unique en ce sens qu'il relie directement l'image à la page avec le contexte.
À moins que votre site ne soit celui d'une agence photo, le trafic pour « photo d'une plage » ne sera pas très utile, mais pour un hôtel, avoir « hôtel avec plage à X » peut être pertinent. Encore une fois, une grande partie de ce trafic peut provenir du reste de la page, mais la valeur de l'attribut alt est une opportunité unique de donner du contexte. (Et avec cela… si vous utilisez l'IA pour créer des textes alternatifs basés sur le fichier image et que vous obtenez « photo d'une plage » comme texte alternatif pour cette image, vous ne tirez pas le meilleur parti du texte alternatif, à la fois pour les utilisateurs et les moteurs de recherche.)
Voilà une excellente description de l'importance du texte alternatif pour le référencement. Le texte alternatif montre comment l'image est directement liée au contenu de la page Web.
En rapport: Google : bonnes pratiques SEO pour le texte alternatif
Pourquoi l'IA échoue pour le texte alternatif
Mueller souligne également une lacune dans l'utilisation de l'IA pour la mise à l'échelle du texte alternatif : en général, une IA décrit l'image mais ne parvient pas à l'étiqueter dans le contexte du contenu. Utiliser un texte alternatif pour communiquer une description informative dans le contexte du texte est la bonne façon de procéder, comme le décrit le W3C, pour le référencement en général et pour des raisons d'accessibilité.
En rapport: Au-delà du référencement : John Mueller sur les images générées par l'IA et la photographie de stock
Lisez la réponse de Mueller sur Reddit :
Texte alternatif d'image à l'ère de la vision par ordinateur