Google affirme qu’il peut gérer plusieurs URL vers le même contenu

John Mueller de Google a répondu à une question sur les URL en double apparaissant après une modification de la structure du site. Sa réponse apporte des éclaircissements sur la manière dont Google gère le contenu en double et sur ce qui influence réellement les décisions d’indexation et de classement.

Préoccupation concernant les URL en double et l’impact du classement

Un propriétaire de site avait modifié la structure des URL de ses pages Web, puis avait découvert plus tard que les anciennes versions de ces URL étaient toujours accessibles et apparaissaient dans Google Search Console.

La personne qui a posé la question sur Reddit craignait que la demande de réexploration des anciennes URL puisse dérouter Google ou entraîner des problèmes de classement.

Ils ont demandé :

«J’ai changé de thème il y a quelque temps et j’ai fait quelques refontes et à un moment donné… J’ai changé toutes les URL de mes recettes en supprimant la partie /recipe/ de site.com/recipe/actualrecipe, donc c’est maintenant juste site.com/actualrecipe mais il y a des URL qui fonctionnent toujours lorsque vous remettez /recipe/ dans l’URL.

Je suis allé chez GSC et j’ai paniqué parce qu’un certain nombre de mes recettes n’étaient pas indexées à cause d’une erreur 5xx (je pense que c’était lorsque mon site était en panne pendant quelques jours).

Maintenant, j’ai déjà demandé que plusieurs d’entre eux soient réexplorés, mais réalisant que Google les ignorait peut-être pour une raison, comme s’il ne voulait pas de doublons.

Mes demandes de réexploration des URL de /recette/ vont-elles dérouter Google qui pourrait pénaliser mon classement pour les doublons ? »

La question reflète une préoccupation raisonnable selon laquelle les URL et le contenu en double pourraient affecter négativement les classements, en particulier lorsque l’erreur est révélée dans les rapports d’indexation de la console de recherche.

Google est capable de gérer les URL en double

John Mueller de Google a répondu à la question en expliquant que plusieurs URL pointant vers le même contenu n’entraînent pas de pénalité ni de perte de visibilité dans les recherches. Il a également noté que ce type de duplication est courant sur le Web, ce qui implique que les systèmes de Google sont expérimentés dans la gestion de ce type de problème.

Il a expliqué :

« C’est bien, mais vous vous compliquez la tâche (Google en choisira un à conserver, mais vous pourriez avoir des préférences).

Il n’y a pas de pénalité ni de rétrogradation de classement si vous avez plusieurs URL menant au même contenu, presque tous les sites l’ont sous forme de variantes. Une grande partie du référencement technique consiste essentiellement à murmurer sur les moteurs de recherche, à être cohérent avec les indices et à surveiller pour s’assurer qu’ils sont récupérés.

Ce à quoi Mueller fait référence, c’est la capacité de Google à canoniser une seule URL comme étant représentative des différentes URL similaires. Comme l’a dit Mueller, plusieurs URL pour essentiellement le même contenu sont un problème fréquent sur le Web.

La documentation de Google répertorie cinq raisons pour lesquelles du contenu en double se produit :

  1. « Variantes de région : par exemple, un contenu pour les États-Unis et le Royaume-Uni, accessible depuis des URL différentes, mais essentiellement le même contenu dans la même langue.
  2. Variantes d’appareil : par exemple, une page avec à la fois une version mobile et une version de bureau
  3. Variantes de protocole : par exemple, les versions HTTP et HTTPS d’un site
  4. Fonctions du site : par exemple, les résultats des fonctions de tri et de filtrage d’une page de catégorie
  5. Variantes accidentelles : par exemple, la version démo du site est accidentellement laissée accessible aux robots”

Le fait est que le contenu en double est quelque chose qui se produit souvent sur le Web et que Google est capable de gérer.

Signaux techniques de référencement

Mueller a déclaré que Google choisirait une URL à conserver, mais a ajouté que le propriétaire du site pourrait avoir des préférences. Cela signifie que Google canonisera lui-même les doublons, mais le propriétaire du site ou le référenceur peut toujours signaler quelle URL est le meilleur choix (l’URL canonique) pour le classement dans les résultats de recherche.

C’est là que le référencement technique entre en jeu. Les liens internes, les redirections, l’utilisation appropriée de rel=”canonical”, la cohérence du plan du site et la cohérence des redirections 301 fonctionnent tous comme des indices qui aident Google à identifier la version que vous souhaitez réellement indexer.

Le vrai problème, ce sont les signaux mixtes

La remarque de Mueller sur le fait de rendre la tâche plus difficile pour vous-même concernait le fait que le propriétaire du site/le référencement passait du temps à demander que les URL soient réexplorées et notait que Google le découvrirait tout seul. Mais ensuite il a également fait référence aux préférences, qui faisaient allusion à tous les signaux que j’ai mentionnés précédemment, en particulier le rel=”canonical”.

Le référencement technique consiste souvent à renforcer les préférences

La description de Mueller du référencement technique comme « chuchotement des moteurs de recherche » est utile car elle capture dans quelle mesure le référencement implique de renforcer vos préférences concernant les URL explorées, le contenu choisi pour être classé et l’indication des pages d’un site Web les plus importantes. Google peut toujours choisir lui-même une version canonique, mais des signaux cohérents augmentent les chances qu’il choisisse la version souhaitée par le propriétaire du site.

Cela en fait un bon exemple de ce qu’est le référencement : permettre à Google d’explorer, d’indexer et de comprendre facilement le contenu. C’est vraiment l’essence du référencement. Il s’agit d’être clair et cohérent dans le contenu, les URL, les liens internes, la navigation globale du site et même dans l’affichage du HTML le plus propre, y compris le HTML sémantique (qui permet à Google d’annoter plus facilement une page Web).

Le HTML sémantique peut être utilisé pour identifier clairement le contenu principal d’une page Web. Cela peut directement aider Google à se concentrer sur ce qu’on appelle le contenu Centerpiece, qui est probablement utilisé pour l’annotation Centerpiece de Google. L’annotation centrale est un résumé du sujet principal de la page Web.

La documentation de canonisation de Google explique :

« Lorsque Google indexe une page, il détermine le contenu principal (ou la pièce maîtresse) de chaque page. Si Google trouve plusieurs pages qui semblent identiques ou dont le contenu principal est très similaire, il choisit la page qui, en fonction des facteurs (ou signaux) collectés par le processus d’indexation, est objectivement la plus complète et la plus utile pour les utilisateurs de recherche, et la marque comme canonique. La page canonique sera explorée le plus régulièrement ; les doublons sont explorés moins fréquemment afin de réduire la charge d’exploration sur les sites. « 

SEO technique et cohérence

En prenant du recul pour adopter une vue au niveau de la forêt, les URL en double concernent en réalité un site Web qui n’est pas cohérent. La cohérence n’est pas souvent considérée comme liée au référencement, mais c’est effectivement le cas, à un niveau général. Chaque fois que je créais un nouveau site Web, j’avais toujours un plan pour le rendre cohérent, des URL aux sujets, et aussi pour pouvoir l’étendre de manière cohérente à mesure que le site Web se développe pour couvrir plus de sujets, pour l’intégrer.

Points à retenir

  • Plusieurs URL vers le même contenu n’entraînent pas de pénalité ni de rétrogradation dans le classement.
  • Google choisira généralement une version à conserver
  • Les propriétaires de sites peuvent influencer ce choix grâce à des signaux techniques cohérents
  • Le vrai problème réside dans les signaux mixtes, et non dans la duplication du contenu lui-même.
  • Le référencement technique revient souvent à renforcer des préférences claires et à vérifier si Google les prend en compte
  • La vision du référencement au niveau de la forêt peut être considérée comme cohérente