L’équipe Search Relations de Google confirme que les pages non indexées n’ont pas d’impact négatif sur le budget d’exploration d’un site Web, quel que soit le nombre de sites.
Ce sujet est abordé non pas une mais trois fois lors de l’édition de novembre 2022 de la session de questions-réponses de Google sur les heures de bureau SEO.
Les défenseurs de la recherche Google John Mueller et Gary Illyes répondent à tour de rôle à trois questions similaires posées par des personnes craignant d’avoir trop de pages non indexées sur leurs sites.
D’après les réponses de Mueller et Illyes, nous apprenons qu’il n’y a pas de « trop » de pages indexées. De plus, à moins que votre site Web ne compte plus d’un million de pages, vous n’avez pas à vous soucier du budget de crawl.
Voici un bref récapitulatif de chaque question et réponse.
Question 1 : Nombre excessif de pages indexées
À 8h23 des heures de bureau de Google en novembre 2022, Illyes répond à une question demandant si un nombre « excessif » de pages indexées est un problème pour la découverte ou l’indexation.
Illyes dit que noindex est un outil pour aider les sites Web à garder le contenu hors des moteurs de recherche. Google encourage l’utilisation de la balise noindex lorsque cela est nécessaire, et pour cette raison, il n’y a aucun effet indésirable qui lui est associé.
« Noindex est un outil très puissant que les moteurs de recherche prennent en charge pour vous aider, ce propriétaire de site, à garder le contenu hors de leurs index. Pour cette raison, il n’entraîne aucun effet indésirable en matière d’exploration et d’indexation. Par exemple, avoir de nombreuses pages sans index n’influencera pas la façon dont Google explore et indexe votre site. »
Question 2 : Ratio de pages indexées/non indexées
La question suivante se pose à 10:22 :
« Devrions-nous garder un œil sur le rapport entre les pages indexées et non indexées dans la Search Console afin de mieux reconnaître le budget de crawl éventuellement gaspillé sur les pages non indexées ?
Mueller démystifie que les sites Web devraient tenter d’équilibrer leurs pages indexées et non indexées.
À cette fin, le budget de crawl est un facteur auquel peu de sites doivent réfléchir ; Muller dit :
« Non, il n’y a pas de ratio magique à surveiller. De plus, pour un site qui n’est pas gigantesque, avec peut-être moins d’un million de pages, vous n’avez vraiment pas à vous soucier du budget de crawl de votre site Web. C’est bien de supprimer les liens internes inutiles, mais pour les sites de petite et moyenne taille, c’est plus un sujet d’hygiène du site qu’un sujet de référencement.
Question 3 : Pages non indexées liées à des sites de spam
À 11:26, une question sur l’absence de pages indexées est légèrement différente des deux précédentes.
La question se lit comme suit :
« De nombreux référenceurs se plaignent d’avoir des millions d’URL signalées comme exclues par noindex dans Google Search Console. Tout cela sur des pages de recherche internes absurdes liées à des sites de spam. Est-ce un problème pour le budget de crawl ? »
Ilyes réitère le point précédent sur le fait que noindex est un outil que les sites peuvent utiliser au besoin.
En supposant que les pages ne sont intentionnellement pas indexées, il n’y a pas lieu de s’inquiéter du fait que la Search Console les signale. Cela ne signifie pas que vous faites quelque chose de mal.
Illyes déclare :
« Noindex est là pour vous aider à garder les choses hors de l’index, et cela n’a pas d’effets négatifs involontaires, comme nous l’avons dit précédemment. Si vous voulez vous assurer que ces pages ou leurs URL, plus précisément, ne se retrouvent pas dans l’index de Google, continuez à utiliser noindex et ne vous souciez pas du budget de crawl.
La source: Google