Google révèle deux nouveaux robots d'exploration Web

Google a révélé les détails de deux nouveaux robots d'exploration optimisés pour récupérer du contenu image et vidéo à des fins de « recherche et développement ». Bien que la documentation ne le dise pas explicitement, il est présumé qu'il n'y aura aucun impact sur le classement si les éditeurs décident de bloquer les nouveaux robots.

Il convient de noter que les données récupérées par ces robots d'exploration ne sont pas explicitement destinées aux données de formation de l'IA, c'est à cela que sert le robot d'exploration étendu de Google.

GoogleAutres robots d'exploration

Les deux nouveaux robots d'exploration sont des versions du robot d'exploration GoogleOther de Google qui a été lancé en avril 2023. Le robot d'exploration GoogleOther d'origine a également été conçu pour être utilisé par les équipes produit de Google à des fins de recherche et de développement dans ce qui est décrit comme des explorations ponctuelles, dont la description offre des indices. sur ce à quoi serviront les nouvelles variantes de GoogleAutres.

L'objectif du robot d'exploration GoogleOther d'origine est officiellement décrit comme :

« GoogleOther est le robot d'exploration générique qui peut être utilisé par diverses équipes produit pour récupérer du contenu accessible au public à partir de sites. Par exemple, il peut être utilisé pour des analyses ponctuelles pour la recherche et le développement interne.

Deux autres variantes de Google

Il existe deux nouveaux robots d'exploration GoogleAutres :

  • GoogleAutre-Image
  • GoogleAutre-Vidéo

Les nouvelles variantes sont destinées à l'analyse des données binaires, c'est-à-dire des données qui ne sont pas du texte. Les données HTML sont généralement appelées fichiers texte, fichiers ASCII ou Unicode. S'il peut être visualisé dans un fichier texte, il s'agit d'un fichier texte/ASCII/Unicode. Les fichiers binaires sont des fichiers qui ne peuvent pas être ouverts dans une application de visualisation de texte, tels que des images, des fichiers audio et vidéo.

Les nouvelles variantes de GoogleAutres sont destinées au contenu image et vidéo. Google répertorie les jetons d'agent utilisateur pour les deux nouveaux robots d'exploration qui peuvent être utilisés dans un fichier robots.txt pour bloquer les nouveaux robots d'exploration.

1. GoogleAutre-Image

Jetons d'agent utilisateur :

  • GoogleAutre-Image
  • GoogleAutre

Chaîne complète de l'agent utilisateur :

GoogleAutre-Image/1.0

2. GoogleAutre-Vidéo

Jetons d'agent utilisateur :

  • GoogleAutre-Vidéo
  • GoogleAutre

Chaîne complète de l'agent utilisateur :

GoogleAutre-Vidéo/1.0

Chaînes d'agent utilisateur GoogleAutres mises à jour récemment

Google a également mis à jour les chaînes de l'agent utilisateur GoogleOther pour le robot d'exploration GoogleOther standard. À des fins de blocage, vous pouvez continuer à utiliser le même jeton d'agent utilisateur qu'auparavant (GoogleAutre). Les nouvelles Users Agent Strings ne sont que les données envoyées aux serveurs pour identifier la description complète des robots, en particulier la technologie utilisée. Dans ce cas, la technologie utilisée est Chrome, avec le numéro de modèle périodiquement mis à jour pour refléter la version utilisée (WXYZ est un espace réservé au numéro de version de Chrome dans l'exemple ci-dessous).

La liste complète des chaînes de l'agent utilisateur GoogleAutres :

  • Mozilla/5.0 (Linux ; Android 6.0.1 ; Nexus 5X Build/MMB29P) AppleWebKit/537.36 (KHTML, comme Gecko) Chrome/WXYZ Mobile Safari/537.36 (compatible ; GoogleAutre)
  • Mozilla/5.0 AppleWebKit/537.36 (KHTML, comme Gecko ; compatible ; GoogleAutre) Chrome/WXYZ Safari/537.36

GoogleAutre famille de robots

Ces nouveaux robots peuvent apparaître de temps en temps dans les journaux de votre serveur et ces informations aideront à les identifier en tant que véritables robots d'exploration de Google et aideront les éditeurs qui souhaiteraient peut-être refuser que leurs images et vidéos soient supprimées à des fins de recherche et de développement.

Lire la documentation mise à jour du robot d'exploration Google

GoogleAutre-Image

GoogleAutre-Vidéo