Google utilise environ 40 signaux pour déterminer les URL canoniques

Dans un épisode récent du podcast Search Off the Record de Google, Allan Scott de l'équipe « Dups » a expliqué comment Google décide quelle URL considérer comme principale lorsqu'il y a des pages en double.

Il a révélé que Google examine environ 40 signaux différents pour sélectionner l'URL principale parmi un groupe de pages similaires.

Environ 40 signaux pour la sélection d'URL canonique

Le contenu en double est un problème courant pour les moteurs de recherche, car de nombreux sites Web comportent plusieurs pages avec un contenu identique ou similaire.

Pour résoudre ce problème, Google utilise un processus appelé canonisation. Ce processus permet à Google de choisir une URL comme version principale à indexer et à afficher dans les résultats de recherche.

Google a discuté de l'importance d'utiliser des signaux tels que les balises rel= »canonical », les plans de site et les redirections 301 pour la canonisation. Cependant, le nombre de signaux impliqués dans ce processus est supérieur à ce à quoi on pourrait s’attendre.

Scott a révélé lors du podcast :

« Je ne suis pas sûr du nombre exact pour le moment, car il varie de haut en bas, mais je soupçonne qu'il se situe aux alentours de 40. »

Certains des signaux connus mentionnés incluent :

  1. rel = balises « canoniques »
  2. Redirections 301
  3. HTTPS contre HTTP
  4. Plans du site
  5. Liens internes
  6. Longueur de l'URL

Le poids et l'importance de chaque signal peuvent varier, et certains signaux, comme les balises rel=”canonical”, peuvent influencer à la fois le processus de clustering et de canonicalisation.

Signaux d’équilibrage

Avec autant de signaux en jeu, Allan a reconnu les défis liés à la détermination de l'URL canonique en cas de conflit de signaux.

Il a déclaré :

« Si vos signaux entrent en conflit les uns avec les autres, le système commencera à se rabattre sur des signaux de moindre importance. »

Cela signifie que même si des signaux forts tels que les balises rel=”canonical” et les redirections 301 sont cruciaux, d’autres facteurs peuvent entrer en jeu lorsque ces signaux ne sont pas clairs ou contradictoires.

En conséquence, le processus de canonisation de Google implique un délicat exercice d’équilibre pour déterminer l’URL canonique la plus appropriée.

Meilleures pratiques pour la canonisation

Des signaux clairs aident Google à identifier l’URL canonique préférée.

Les meilleures pratiques incluent :

  1. Utilisez correctement les balises rel= »canonical ».
  2. Implémentez des redirections 301 pour le contenu déplacé de manière permanente.
  3. Assurez-vous que les versions HTTPS des pages sont accessibles et liées.
  4. Soumettez des plans de site avec les URL canoniques préférées.
  5. Gardez les liens internes cohérents.

Ces signaux aident Google à trouver les URL canoniques correctes, améliorant ainsi l'exploration, l'indexation et la visibilité de la recherche de votre site.

Erreurs à éviter

Voici quelques erreurs courantes à surveiller.

1. Balises canoniques incorrectes ou contradictoires:

  • Pointant vers des pages inexistantes ou 404
  • Plusieurs balises canoniques avec différentes URL sur une seule page
  • Pointant vers un domaine entièrement différent

Réparer: Vérifiez à nouveau les balises canoniques, utilisez-en une seule par page et utilisez des URL absolues.

2. Chaînes ou boucles canoniques

Lorsque la page A pointe vers la page B comme canonique, mais que la page B renvoie vers A ou une autre page, créant une boucle.

Réparer: assurez-vous que les URL canoniques pointent toujours vers la version finale et préférée de la page.

3. Utiliser ensemble les balises noindex et canoniques

Envoi de signaux mitigés aux moteurs de recherche. Noindex signifie ne pas indexer la page du tout, ce qui rend les canoniques non pertinents.

Réparer: utilisez des balises canoniques pour la consolidation et noindex pour l'exclusion.

4. Canonisation pour rediriger ou ne pas indexer les pages

Pointer les canoniques vers des pages redirigées ou sans index confond les moteurs de recherche.

Réparer: Les URL canoniques doivent avoir un statut de 200 et être indexables.

5. Ignorer la sensibilité à la casse

Une casse d'URL incohérente peut entraîner des problèmes de contenu en double.

Réparer: Gardez la casse de l'URL et de la balise canonique cohérente.

6. Surveiller la pagination et les paramètres

Le contenu paginé et les URL contenant beaucoup de paramètres peuvent entraîner une duplication s'ils sont mal gérés.

Réparer: utilisez des balises canoniques pointant vers la première page ou « Afficher tout » pour la pagination et gardez les paramètres cohérents.

Points clés à retenir

Il est peu probable que la liste complète des plus de 40 signaux utilisés pour déterminer les URL canoniques soit rendue publique.

Il s’agit néanmoins d’une discussion perspicace qui mérite d’être soulignée.

Voici les principaux points à retenir :

  • Google utilise environ 40 signaux différents pour déterminer les URL canoniques, les balises rel= »canonical » et les redirections 301 étant parmi les indicateurs les plus puissants.
  • Lorsque les signaux sont en conflit, Google s'appuie sur des signaux secondaires pour prendre sa décision.
  • Une mise en œuvre claire et cohérente des signaux de canonisation (balises, redirections, plans de site, liens internes) est cruciale
  • Des erreurs courantes telles que des chaînes canoniques, des signaux mixtes ou des implémentations incorrectes peuvent dérouter les moteurs de recherche.

Écoutez la discussion complète dans la vidéo ci-dessous :