Dans une récente publication sur LinkedIn, l'analyste de Google Gary Illyes a attiré l'attention sur deux problèmes qui affectent les robots d'exploration Web : les soft 404 et autres erreurs « cryptographiques ».
Ces erreurs apparemment anodines peuvent avoir un impact négatif sur les efforts de référencement.
Comprendre les erreurs logicielles 404
Les erreurs logicielles 404 se produisent lorsqu'un serveur Web renvoie un code d'état HTTP standard « 200 OK » pour des pages qui n'existent pas ou contiennent des messages d'erreur. Cela induit les robots d’exploration en erreur, les obligeant à gaspiller des ressources sur du contenu inexistant ou inutile.
Illyes a comparé l'expérience à la visite d'un café où chaque article n'est pas disponible bien qu'il soit indiqué sur le menu. Bien que ce scénario puisse être frustrant pour les clients humains, il pose un problème plus grave pour les robots d'exploration Web.
Comme l'explique Illyes :
« Les robots d'exploration utilisent les codes d'état pour interpréter si une récupération a réussi, même si le contenu de la page n'est en fait qu'un message d'erreur. Ils pourraient revenir sans problème sur la même page encore et encore, gaspillant ainsi vos ressources, et s'il y a beaucoup de pages de ce type, beaucoup plus de ressources. »
Les coûts cachés des erreurs logicielles
Les conséquences des erreurs logicielles 404 s’étendent au-delà de l’utilisation inefficace des ressources du robot.
Selon Illyes, il est peu probable que ces pages apparaissent dans les résultats de recherche car elles sont filtrées lors de l’indexation.
Pour lutter contre ce problème, Illyes conseille de fournir le code d’état HTTP approprié lorsque le serveur ou le client rencontre une erreur.
Cela permet aux robots d’exploration de comprendre la situation et d’allouer leurs ressources plus efficacement.
Illyes a également mis en garde contre les robots d'exploration limitant le débit avec des messages tels que « TROP DE DEMANDES RALENTISSENT », car les robots d'exploration ne peuvent pas interpréter de telles instructions textuelles.
Pourquoi SEJ s'en soucie
Les erreurs soft 404 peuvent avoir un impact sur la capacité d'exploration et l'indexation d'un site Web.
En résolvant ces problèmes, les robots d'exploration peuvent se concentrer sur la récupération et l'indexation de pages contenant un contenu précieux, améliorant ainsi potentiellement la visibilité du site dans les résultats de recherche.
L'élimination des erreurs logicielles 404 peut également conduire à une utilisation plus efficace des ressources du serveur, car les robots d'exploration ne gaspilleront pas de bande passante en visitant à plusieurs reprises les pages d'erreur.
Comment cela peut vous aider
Pour identifier et résoudre les erreurs logicielles 404 sur votre site Web, envisagez les étapes suivantes :
- Surveillez régulièrement les rapports d'exploration et les journaux de votre site Web pour identifier les pages renvoyant des codes d'état HTTP 200 malgré des messages d'erreur.
- Implémentez une gestion des erreurs appropriée sur votre serveur pour garantir que les pages d'erreur sont servies avec les codes d'état HTTP appropriés (par exemple, 404 pour non trouvé, 410 pour supprimé définitivement).
- Utilisez des outils tels que Google Search Console pour surveiller la couverture de votre site et identifier toutes les pages signalées comme erreurs 404 logicielles.
La résolution proactive des erreurs logicielles 404 peut améliorer la capacité d'exploration, l'indexation et le référencement de votre site Web.