Google a mis à jour sa documentation Googlebot pour clarifier les informations sur les limites de taille de fichier.
Le changement implique le déplacement des informations sur les limites de taille de fichier par défaut de la page Googlebot vers la documentation plus large du robot d’exploration de Google. Google a également mis à jour la page Googlebot pour être plus précis sur les propres limites de Googlebot.
Quoi de neuf
Le journal des modifications de la documentation de Google décrit la mise à jour comme une clarification en deux parties.
Les limites de taille de fichier par défaut qui figuraient auparavant sur la page Googlebot apparaissent désormais dans la documentation du robot d’exploration. Google a déclaré que l’emplacement d’origine n’était pas l’endroit le plus logique car les limites s’appliquent à tous les robots d’exploration et de récupération de Google, pas seulement à Googlebot.
Les valeurs par défaut étant désormais hébergées dans la documentation du robot d’exploration, Google a mis à jour la page Googlebot pour décrire plus précisément les limites de taille de fichier spécifiques de Googlebot.
La documentation sur l’infrastructure d’exploration indique une valeur par défaut de 15 Mo pour les robots d’exploration et les récupérateurs de Google, tandis que la page Googlebot répertorie désormais 2 Mo pour les types de fichiers pris en charge et 64 Mo pour les PDF lors de l’exploration pour la recherche Google.
La présentation du robot d’exploration décrit une limite par défaut dans l’infrastructure d’exploration de Google, tandis que la page Googlebot décrit les limites spécifiques à la recherche Google pour Googlebot. Chaque ressource référencée dans le HTML, telle que CSS et JavaScript, est récupérée séparément.
Pourquoi c’est important
Cela correspond à un modèle que Google utilise depuis fin 2025. En novembre, Google a migré sa documentation d’exploration de base vers un site autonome, la séparant de Search Central. Le raisonnement était que l’infrastructure d’exploration de Google dessert des produits au-delà de la recherche, notamment Shopping, News, Gemini et AdSense.
En décembre, davantage de documentation a suivi, notamment des conseils de navigation à facettes et une optimisation du budget d’exploration.
La dernière mise à jour poursuit cette réorganisation. La limite de taille de fichier de 15 Mo a été documentée pour la première fois en 2022, lorsque Google l’a ajoutée à la page d’aide de Googlebot. Mueller avait confirmé à l’époque que cette limite n’était pas nouvelle. C’était en vigueur depuis des années. Google venait juste de le mettre dans le dossier.
Lors de la gestion des budgets d’exploration ou du dépannage de l’indexation sur des pages riches en contenu, les documents de Google décrivent désormais les limites différemment selon l’endroit où vous regardez.
La présentation de l’infrastructure d’exploration répertorie 15 Mo comme valeur par défaut pour tous les robots d’exploration et les récupérateurs. La page Googlebot répertorie 2 Mo pour les fichiers HTML et texte pris en charge, et 64 Mo pour les fichiers PDF. Le journal des modifications de Google n’explique pas comment ces chiffres sont liés les uns aux autres.
Les limites par défaut figurent désormais dans la documentation de présentation du robot, tandis que les limites spécifiques à Googlebot se trouvent sur la page Googlebot.
Regarder vers l’avenir
La réorganisation de la documentation de Google suggère qu’il y aura probablement davantage de mises à jour du site d’infrastructure d’exploration dans les mois à venir. En séparant les valeurs par défaut à l’échelle du robot d’exploration de la documentation spécifique au produit, Google peut documenter plus facilement les nouveaux robots d’exploration et les récupérateurs au fur et à mesure de leur introduction.