La question Ask An SEO d'aujourd'hui vient de Mandeep, qui rencontre des problèmes d'indexation sur son site.
Mandeep demande :
« Nous avons repensé un site Internet et nous avons ajouté quelques nouvelles pages. Certaines pages ont été indexées avec succès et d’autres non.
J'ai essayé plusieurs fois sur Google mais cela ne fonctionne pas. Maintenant, pendant que je soumets l'URL à indexer, cette erreur s'affiche via Google Search Console : Découvert – actuellement non indexé […]
J'ai tout essayé mais rien ne fonctionne. S'il vous plaît, aidez-moi à résoudre ce problème.
Cet avertissement provient de la section « Pages » du rapport « Indexation » de Google Search Console. Ce rapport donne aux utilisateurs un aperçu des pages explorées et indexées par Google et des problèmes qu'il a pu rencontrer.
Le rapport donnera des détails sur les pages qui ont été explorées et indexées avec succès. Il répertorie également les raisons pour lesquelles les pages du site n'ont pas été indexées.
Est-ce un problème si une page n’est pas indexée ?
La plupart des sites ont des pages qui ne sont pas indexées. Celles-ci se font souvent à la demande du propriétaire du site Web.
Par exemple, une page peut être délibérément exclue des index des moteurs de recherche au moyen d'une balise HTML « noindex » sur la page, ou peut-être son exploration est-elle bloquée dans le fichier robots.txt.
Les URL délibérément exclues de l'indexation apparaîtront dans ce rapport, ainsi que les pages présentant des problèmes d'indexation problématiques.
En général, l’exploration et l’indexation d’une nouvelle page d’un site Web peuvent prendre un certain temps. Une nouvelle page qui met du temps à apparaître parmi les pages « indexées » du rapport n'est pas toujours le signe d'un problème.
Toutes les raisons contenues dans le rapport « Pourquoi les pages ne sont pas indexées » ne doivent pas être traitées.
Problèmes d'indexation
Google n'explorera pas et n'indexera pas chaque URL qu'il trouve. Votre principale préoccupation en tant que gestionnaire de site Web est que les pages que vous souhaitez voir apparaître comme résultat de recherche soient indexées.
Essentiellement, s’ils ne sont pas indexés, ils ne pourront pas figurer dans les résultats de recherche.
Il existe plusieurs raisons dans le rapport « Pourquoi les pages ne sont pas indexées » faire suggérer un problème sur le site qui devrait faire l'objet d'une enquête. Par exemple, « Erreur de serveur (500) » et « Soft 404 ».
Ces indicateurs ne posent pas nécessairement un problème pour les URL individuelles si ce ne sont pas celles que vous souhaitez indexer, mais ils peuvent indiquer un problème plus large avec le site.
Qu'est-ce que « Découvert – Actuellement non indexé » ?
« Découvert – actuellement non indexé » est une erreur que Google signale pour les URL qu'il connaît mais qu'il n'a pas indexées.
Ce qu'il est important de retenir, c'est que les URL n'apparaîtront pas dans ce compartiment si elles peuvent s'insérer dans un autre dans le rapport.
Par exemple, une page avec une balise noindex peut techniquement avoir été découverte par Google et non indexée, mais elle apparaîtrait dans le compartiment « Exclu par la balise 'noindex' », donc les pages dans le compartiment « Découvertes – actuellement non indexées » sont là. pour une autre raison.
L'explication donnée par Google pour une URL apparaissant comme « Découverte – actuellement non indexée » est la suivante :
« La page a été trouvée par Google, mais pas encore explorée. En règle générale, Google souhaitait explorer l'URL, mais cela risquait de surcharger le site ; par conséquent, Google a reprogrammé l'exploration. C'est pourquoi la date de la dernière exploration est vide dans le rapport.
Google essaie de faire explorer consciencieusement ses robots.
Autrement dit, comme Googlebot n'est pas le seul visiteur d'un site, et peut-être l'un des nombreux robots qui l'explorent, il ne veut pas faire planter le site en envoyant trop de « requêtes » au serveur.
Qu'est-ce qui pourrait faire qu'une URL soit « découverte – actuellement non indexée » ?
Il existe deux raisons principales pour lesquelles une page est connue de Google mais non indexée. John Muller a donné des détails à ce sujet en 2023.
Essentiellement, outre les préoccupations concernant la capacité du serveur à résister à l'exploration, la qualité des pages est également prise en compte.
Maintenant, si une page n’a pas été explorée, comment Google peut-il connaître sa qualité ? Eh bien, ce n'est pas possible. Ce qu'il peut faire, c'est faire des hypothèses basées sur la qualité des pages ailleurs sur le site.
C'est vrai : des pages fines, en double et de faible valeur ailleurs sur votre site Web peuvent affecter l'indexation de vos pages principales.
Comment résoudre le problème
Il n'existe pas de solution miracle pour déplacer une page de « Découverte – actuellement non indexée » vers « Indexée », mais vous pouvez essayer plusieurs solutions.
Vérifiez si la page est réellement indexée
La première étape consiste à déterminer si le rapport de la Google Search Console est exact et à jour.
Dans le coin supérieur droit du rapport, vous verrez la date de « Dernière mise à jour ». Cela vous donne une idée si le rapport est peut-être obsolète.
Ensuite, allez sur Google et effectuez une site:[yourwebsitedomain] URL :[the URL slug of the page you want to index] recherche.
Si la page est renvoyée comme résultat de recherche, vous savez qu'elle est réellement indexée.
Donnez au rapport le temps d'être mis à jour, et il commencera à apparaître dans la section « Indexé » et non dans le rapport « Découvert – actuellement non indexé ».
Vérifiez la qualité des pages de votre site
Ensuite, vous voudrez peut-être considérer la qualité globale de votre site Web, car cela pourrait être la raison pour laquelle Google n'indexe pas votre page.
N'oubliez pas que la qualité n'est pas seulement une mesure des mots sur votre site, de leur pertinence par rapport aux requêtes de recherche et du « EEAT » global affiché. Au lieu de cela, John Muller de Google l'a décrit comme suit :
« Lorsqu'il s'agit de qualité du contenu, nous ne parlons pas uniquement du texte de vos articles.
C'est vraiment la qualité de votre site Web dans son ensemble.
Et cela inclut tout, de la mise en page au design.
Par exemple, la façon dont vous présentez les choses sur vos pages, la façon dont vous intégrez les images, la façon dont vous travaillez rapidement, tous ces facteurs entrent en jeu là-bas.
Alors, examinez votre site Web en gardant ces critères à l’esprit. Comment la qualité de votre site Web se compare-t-elle à celle de vos concurrents ?
Un audit approfondi de votre site Web est un bon point de départ.
Rechercher les pages en double
Parfois, un site Web peut contenir des pages de mauvaise qualité ou en double dont le gestionnaire du site Web n'a aucune connaissance.
Par exemple, une page peut être accessible via plusieurs URL. Vous pourriez avoir une page « Contactez-nous » qui existe à la fois sur exampledomain.com/contact-us et exampledomain.com/contact-us/.
L'URL avec et l'URL sans la « barre oblique finale » sont considérées comme des pages distinctes par Googlebot s'il peut les atteindre toutes les deux, et le serveur renvoie un code d'état 200. Autrement dit, ce sont toutes deux des pages en direct.
Il est possible que toutes vos pages soient dupliquées de la même manière.
Il se peut également que votre site Web comporte de nombreux paramètres d’URL dont vous ignorez l’existence. Il s'agit d'URL qui contiennent des « chaînes de requête », telles que exampledomain.com/dress?colour=red.
Ils sont généralement provoqués par les options de filtrage et de tri de votre site Web. Dans un site Web de commerce électronique, cela peut ressembler à une page de catégorie de produits filtrée selon des critères tels que la couleur et pouvant être triée par prix.
De ce fait, ce filtrage et ce tri ne changent pas les principales fonctionnalités de la page, mais uniquement les produits répertoriés. Il s'agit de pages techniquement distinctes et explorables qui peuvent provoquer de nombreux doublons sur votre site.
Vous pensez peut-être que votre site Web ne contient que 100 pages de haute qualité. Cependant, un Googlebot peut voir des centaines de milliers de pages quasi-dupliquées en raison de ces problèmes techniques.
Façons de corriger « Découvert – Actuellement non indexé »
Une fois que vous avez identifié les causes probables de la non-indexation de votre URL, vous pouvez tenter de y remédier.
Si votre site Web comporte des pages en double, du contenu de mauvaise qualité, supprimé ou d'autres problèmes de qualité, c'est par où commencer.
Comme avantage secondaire, vous verrez probablement votre classement s'améliorer sur vos pages à mesure que vous travaillez pour résoudre ces problèmes.
Signifier l'importance de la page
Dans l'exemple de notre question d'ouverture, il y a une page spécifique que Mandeep a du mal à indexer.
Dans ce scénario, je suggérerais d'essayer de renforcer l'importance de la page aux yeux des moteurs de recherche. Donnez-leur une raison de l'explorer.
Ajouter la page au plan du site XML du site Web
Une façon de montrer à Google qu'il s'agit d'une page importante qui mérite d'être explorée et indexée consiste à l'ajouter au plan de site XML de votre site Web.
Il s’agit essentiellement d’un panneau indiquant toutes les URL que vous pensez que les robots de recherche devraient explorer.
N'oubliez pas que Googlebot sait déjà que la page existe ; il ne pense tout simplement pas qu'il soit avantageux de l'explorer et de l'indexer.
S'il figure déjà dans le plan du site XML, ne vous arrêtez pas là. Considérez ces prochaines étapes.
Ajouter des liens internes à la page
Une autre façon de montrer l’importance d’une page consiste à créer un lien vers celle-ci à partir des pages internes du site.
Par exemple, ajouter la page à votre système de navigation principal, comme le menu principal.
Ou ajoutez-y des liens contextuels à partir de la copie sur d’autres pages de votre site Web. Ceux-ci signifieront à Googlebot qu’il s’agit d’une page importante de votre site Web.
Ajouter des liens externes à la page
Backlinks – ils constituent un élément fondamental du référencement. Nous savons depuis un certain temps que Google utilisera des liens provenant d'autres sites Web pour déterminer la pertinence et l'autorité d'une page par rapport à un sujet.
Si vous avez du mal à montrer à Google que votre page est de qualité suffisante pour être indexée, le fait d'avoir des liens externes provenant de sites Web pertinents et réputés pointant vers elle peut vous rassurer davantage sur la valeur de la page.
Par exemple, si la page que vous avez du mal à indexer est la page détaillée du produit d'une robe rouge spécifique, la présentation de la page de cette robe dans certains blogs de mode peut donner à Google le signal qu'il s'agit d'une page de haute qualité.
Soumettez-le pour qu'il soit exploré
Une fois que vous avez apporté des modifications à votre site Web, essayez de soumettre à nouveau la page à explorer via Google Search Console.
Si vous remarquez dans le rapport « Indexation » de Google Search Console que l'URL se trouve toujours dans la catégorie « Découverte – actuellement non explorée » après un certain temps (cela peut prendre de quelques jours à quelques semaines pour que Google explore une page soumise). ), alors vous savez que vous rencontrez potentiellement encore des problèmes avec la page.
En résumé
Optimisez votre site Web pour l'exploration et l'indexation. Si vous faites cela, vous verrez probablement ces pages passer de « Découvertes – actuellement non indexées » à « Indexées ».
L'optimisation de votre site Web particulier nécessitera une analyse approfondie de la qualité globale du site et l'identification de la manière de transmettre l'importance des pages « Découvertes – actuellement non indexées » à Googlebot.
Plus de ressources :