L’agent qui visite votre site Web connaît la personne qui l’a envoyé.
C’est le changement sous Gemini Deep Research Max de Google, lancé le 21 avril 2026, en tant qu’aperçu public sur le niveau payant de l’API Gemini. Deep Research Max lui-même est un déploiement restreint. Le modèle qu’il propose est un aperçu de ce que deviendra le Web agent lorsque les autres principaux fournisseurs suivront, ce qu’ils font généralement en un trimestre ou deux sur des fonctionnalités comme celle-ci. Lorsqu’un agent de récupération mixte s’exécute, il arrive avec un contexte privé : les données financières de l’utilisateur, ses magasins de fichiers, ses flux de données professionnelles connectés, le tout fusionné dans la requête avant que l’agent n’atteigne une page.
Pour les professionnels du Web, il s’agit du prochain chapitre de l’histoire du Web agent. L’affirmation selon laquelle les agents constituent une nouvelle classe principale de visiteurs dure depuis des mois. Depuis, la revendication a évolué. Les agents sont une nouvelle classe de visiteurs principale avec un contexte privé. Le raisonnement qui décide si votre page répond à une requête s’exécute sur un ensemble d’entrées plus grand que votre page. Le poids que l’agent accorde à votre contenu dépend du fait qu’il ajoute ou non quelque chose que les sources privées n’ont pas déjà fourni. Il s’agit du moment de la récupération mixte dans l’histoire du Web agent, et il se situe du côté de l’offre, de la manière dont les agents récupèrent, et non de la couche produit destinée à l’utilisateur.
L’ancienne posture d’optimisation de la recherche IA (écrire du contenu qui correspond à la requête par mot-clé) s’affaiblissait avant cela. Il s’affaiblit encore davantage maintenant. La nouvelle posture est celle de la prévisibilité structurelle : relations d’entité propres, identité canonique, données vivantes, indépendance de rendu. La structure est fonctionnellement importante pour l’agent. Lorsque l’agent arrive avec le contexte, le contenu qu’il sélectionne est le contenu que son modèle peut fusionner proprement avec tout ce qu’il possède déjà.
La récupération mixte donne un aperçu de la couche suivante du Web agent
Gemini Deep Research Max de Google, en avant-première publique sur le niveau API payant à partir du 21 avril, peut extraire quatre classes d’entrée dans une seule boucle de raisonnement : le Web public, les téléchargements de fichiers, les magasins de fichiers connectés et les serveurs MCP distants arbitraires. D’après l’annonce de Google, l’agent « recherche sur le Web, les MCP distants arbitraires, les téléchargements de fichiers et les magasins de fichiers connectés, ou tout sous-ensemble d’entre eux ».
Les deux nouvelles classes (magasins de fichiers et MCP distants) partagent une propriété. Ils sont privés par défaut. L’agent les lit uniquement avec le consentement de l’utilisateur. Une fois connecté, un fournisseur de données financières ou un CRM d’entreprise expose ses données à Gemini via le Model Context Protocol, le standard ouvert d’Anthropic avec plus de 97 millions d’installations en mars 2026. L’agent de Google récupère ces sources privées avec la même fiabilité qu’il lit sur le Web ouvert, dans le même processus de raisonnement.
Il s’agit du changement structurel que tous ceux qui regardent le Web agent attendaient d’un fournisseur majeur : le Web public et le contexte privé, fusionnés par l’agent, dans une seule requête. Les Gémeaux sont les premiers.
Le modèle n’est pas encore là pour la plupart des opérateurs. Deep Research Max est un aperçu public derrière une API payante, et non une fonctionnalité de l’application grand public Gemini. La plupart des sites Web ne seront pas lus par un agent de récupération mixte ce trimestre. Ce que Google a annoncé le 21 avril, c’est la direction, pas l’arrivée. Considérez-le comme un indicateur avancé : si cette architecture évolue et que les principaux fournisseurs se copient généralement en un trimestre ou deux sur des fonctionnalités comme celle-ci, le travail de l’opérateur devient réel avant le trafic.
Le partage de signal s’effondre lorsque l’agent dispose de meilleures alternatives
Dans une requête de récupération mixte, chaque source connectée est en compétition pour le partage du signal : le Web ouvert, les magasins de fichiers de l’utilisateur et tous les serveurs MCP privés. Le poids d’une source unique est proportionnel à la façon dont l’agent peut extraire et fusionner son signal avec tout ce que l’agent détient.
Pour les sites Web publics, cela modifie le terrain de concurrence de deux manières.
Premièrement, les sites Web axés sur la machine gagnent plus de parts de citations. Une page avec des données structurées propres, des relations d’entités sans ambiguïté et un rendu qui ne cache pas le contenu derrière JavaScript est facile à fusionner pour l’agent avec le contexte privé de l’utilisateur. La réponse fusionnée fait référence à la première page de la machine, car cette page a fourni du matériel utilisable et fusionnable.
Deuxièmement, les sites Web mal structurés perdent la part de signal qu’ils obtenaient auparavant gratuitement. À l’ère du Web uniquement, même une page désordonnée pouvait apparaître dans une citation car il n’existait pas de meilleure alternative au Web public. À l’ère de la récupération mixte, l’alternative peut être les documents téléchargés par l’utilisateur ou un MCP connecté avec des données plus propres. La page de contenu désordonnée perd le partage de citations qu’elle utilisait pour se diviser avec des sources propres.
Il s’agit d’une compétition différente du référencement classique. Le référencement classique classe les pages les unes par rapport aux autres. La récupération mixte classe les pages en fonction du propre contexte de l’utilisateur. Vous ne pouvez pas voir les sources concurrentes. Vous pouvez seulement vous assurer que lorsque l’agent atteint votre page publique, la page apporte quelque chose d’extractible et sans ambiguïté.
Le schéma de produit et d’offre structurés est cité plus souvent que les descriptions non structurées lorsque le contexte privé de l’utilisateur touche à tout ce qui s’y rapporte. L’identité canonique, les relations d’entité claires et l’indépendance de rendu deviennent toutes un levier plus important lorsque l’agent fusionne le signal entre les sources. L’inversion du trafic IA d’Adobe au premier trimestre 2026 a été la preuve, du côté de la demande, que le commerce structuré gagne dans la recherche IA ; la récupération mixte est le mécanisme du côté de l’offre qui produit le même effet sur le reste du Web.
La contre-lecture honnête : certaines requêtes parcourent entièrement votre site Web
Toutes les requêtes de récupération mixte ne finiront pas par citer un site Web public. Certaines requêtes pourront répondre entièrement à partir des sources connectées de l’utilisateur. Un analyste financier exécutant Deep Research Max sur un serveur MCP interne, ainsi que des rapports trimestriels téléchargés, n’aura peut-être jamais besoin du Web public pour cette réponse. Le trafic de cette requête ne transite nulle part ; la réponse est satisfaite à l’intérieur de la limite du contexte privé.
Il s’agit d’un véritable sous-ensemble. La plupart des requêtes mélangent encore sources publiques et privées, car la plupart des questions analytiques touchent les deux.
La récupération mixte ne signifie pas que chaque site Web génère moins de trafic. Cela signifie que l’agent est plus sélectif quant à ce qu’il utilise. La barre monte pour les sources choisies par l’agent. Deep Research Max est un aperçu de ce que le Web agent est sur le point d’exiger. Les sites Web axés sur les machines prendront des parts de marché lorsque cette échelle arrivera. Le contenu non structuré continuera à le perdre. Google nous a montré le modèle le 21 avril, mais c’est à l’échelle qui suit que commence le véritable travail des professionnels du Web, et il est temps de faire ce travail avant que le trafic ne rattrape son retard.
Plus de ressources :
Cet article a été initialement publié sur No Hacks.