De nouvelles données montrent que la limite d’exploration de 2 Mo de Googlebot est suffisante

. Cependant, il contient également des éléments en ligne tels que le contenu des balises de script ou le style ajouté à d’autres balises. Cela peut rapidement conduire à un gonflement du document HTML.

C’est la même chose que Googlebot télécharge au format HTML, juste le balisage sur la page, pas les liens vers JavaScript ou CSS.

Selon le dernier rapport de HTTPArchive, la taille moyenne médiane réelle du HTML brut est de 33 kilo-octets. Le poids de page le plus lourd au 90e centile est de 155 kilo-octets, ce qui signifie que le code HTML de 90 % des sites a une taille inférieure ou approximativement égale à 155 kilo-octets. Ce n’est qu’au 100e centile que la taille du HTML explose jusqu’à dépasser deux mégaoctets, ce qui signifie que les pages pesant deux mégaoctets ou plus sont des valeurs aberrantes extrêmes.

Le rapport HTTPArchive explique :

« La taille HTML est restée uniforme entre les types d’appareils pour les 10e et 25e centiles. À partir du 50e centile, le HTML du bureau était légèrement plus grand.

Ce n’est qu’au 100e centile qu’il y a une différence significative lorsque l’ordinateur de bureau atteint 401,6 Mo et le mobile, 389,2 Mo. »

Les données séparent les mesures de la page d’accueil des mesures de la page intérieure et montrent étonnamment qu’il y a peu de différence entre les poids des deux. Les données sont expliquées :

« Il y a peu de disparité entre les pages intérieures et la page d’accueil en ce qui concerne la taille HTML, qui ne devient vraiment apparente qu’au 75e percentile et au-dessus.

Au 100e centile, la disparité est importante. La page HTML intérieure a atteint la taille incroyable de 624,4 Mo, soit 375 % de plus que la page HTML de la page d’accueil à 166,5 Mo. »

Les tailles HTML des appareils mobiles et des ordinateurs de bureau sont similaires

Il est intéressant de noter que les tailles de page entre les versions mobiles et de bureau étaient remarquablement similaires, que HTTPArchive mesurait la page d’accueil ou l’une des pages intérieures.

HTTPArchive explique :

« La différence de taille entre les appareils mobiles et les ordinateurs de bureau est extrêmement mineure, ce qui implique que la plupart des sites Web proposent la même page aux utilisateurs mobiles et aux utilisateurs d’ordinateurs de bureau.

Cette approche réduit considérablement la quantité de maintenance pour les développeurs, mais signifie que le poids global de la page est susceptible d’être plus élevé dans la mesure où deux versions du site sont effectivement déployées sur une seule page.

Bien que le poids global de la page puisse être plus élevé puisque le HTML pour mobile et ordinateur existe simultanément dans le code, comme indiqué précédemment, le poids réel est encore bien inférieur au seuil de deux mégaoctets jusqu’au 100e centile.

Étant donné qu’il faut environ deux millions de caractères pour pousser le code HTML du site Web à deux mégaoctets et que les données HTTPArchive basées sur des sites Web réels montrent que la grande majorité des sites sont bien en dessous de la limite de 2 Mo de Googlebot, on peut dire sans se tromper qu’il est acceptable de rayer la taille HTML de la liste des éléments de référencement dont il faut s’inquiéter.

Apprivoisez les robots

Dave Smart de Tame The Bots a récemment annoncé avoir mis à jour son outil afin qu’il cesse désormais d’explorer à la limite de deux mégaoctets pour ceux dont les sites sont extrêmement aberrants, montrant à quel moment Googlebot arrêterait d’explorer une page.

Intelligent posté :

« Au risque d’exagérer à quel point il s’agit d’un problème réel (ce n’est vraiment pas le cas pour 99,99% des sites, j’imagine), j’ai ajouté une fonctionnalité à tamethebots.com/tools/fetch-… pour limiter les fichiers texte à 2 Mo pour simuler cela. »

Capture d’écran de l’interface Tame The Bots

L’outil montrera à quoi ressemblera la page à Google si l’exploration est limitée à deux mégaoctets de HTML. Mais il n’indique pas si la page testée dépasse deux mégaoctets, ni quel est le poids de la page Web. Pour cela, il existe d’autres outils.

Outils qui vérifient la taille des pages Web

Il existe quelques sites d’outils qui affichent la taille HTML, mais en voici deux qui affichent uniquement la taille de la page Web. J’ai testé la même page sur chaque outil et ils ont tous deux montré à peu près le même poids de page, à quelques kilo-octets près.

Vérificateur de taille de page Web Toolsaday

Le vérificateur de taille de page Web Toolsaday, au nom intéressant, permet aux utilisateurs de tester une URL à la fois. Cet outil spécifique ne fait qu’une seule chose, permettant d’obtenir facilement une lecture rapide du poids d’une page Web en kilo-octets (ou plus si la page se situe dans le 100e centile).

Capture d’écran des résultats des tests Toolsaday

Vérificateur de taille de page de site Web de petits outils de référencement

Le vérificateur de taille de page de site Web Small SEO Tools diffère de l’outil Toolsaday en ce sens que Small SEO Tools permet aux utilisateurs de tester dix URL à la fois.

Pas de quoi s’inquiéter

L’essentiel concernant la limite d’exploration de deux mégaoctets de Googlebot est que ce n’est pas quelque chose dont le SEO moyen doit s’inquiéter. Cela affecte littéralement un très petit pourcentage de valeurs aberrantes. Mais si cela vous fait du bien, essayez l’un des outils de référencement ci-dessus pour vous rassurer ou rassurer vos clients.