Si quelqu’un m’avait demandé il y a un an quelle pourrait être la prochaine grande innovation des grandes sociétés d’IA, je suis presque sûr que je n’aurais pas répondu « un navigateur ».
Mais c’est exactement ce qu’ont fait OpenAI et Perplexity, chacun lançant ses propres nouveaux navigateurs brillants compatibles avec l’IA, Atlas et Comet, respectivement.
Si vous lisez les communications publiques ou regardez les démos de lancement, les deux sociétés présentent leurs nouveaux navigateurs comme la première étape vers une refonte complète de la façon dont les consommateurs réguliers utilisent Internet. Dans le livestream d’OpenAI pour le lancement d’Atlas, Sam Altman a déclaré que « l’IA représente une opportunité rare une fois par décennie de repenser ce que peut être un navigateur ».
Sur Substack, Fidji Simo, PDG des applications d’OpenAI, a écrit à propos d’Atlas et de ChatGPT « qui évoluent pour devenir le système d’exploitation de votre vie ».
Aravind Srinivas, PDG de Perplexity, a utilisé un langage similaire, décrivant Comet comme un « système d’exploitation cognitif », tandis que Jesse Dwyer, qui a travaillé sur Comet, est largement cité en qualifiant le navigateur de « système d’exploitation de votre esprit ».
Tout cela semble extrêmement transformateur. Mais je ne le vois tout simplement pas. Du moins pas encore.
Bien que ces expressions aient pu être bien entendues dans les groupes de discussion, elles n’ont en réalité aucun sens. Un navigateur n’est pas un système d’exploitation exactement de la même manière que ChatGPT ou Perplexity.
Chrome, Edge et Safari sont chacun liés à une vaste suite de produits et d’outils numériques centrés sur un système d’exploitation différent. S’il est vrai que n’importe qui peut installer et utiliser n’importe lequel de ces navigateurs, c’est cette intégration approfondie avec une suite complète d’outils propriétaires qui crée des écosystèmes et des flux de travail.
Se pourrait-il que, dans leur folle course pour trouver des modèles de monétisation durables, OpenAI et Perplexity aient tous deux été victimes d’un biais de survie ?
Ce que les entreprises technologiques peuvent apprendre des bombardiers de la Seconde Guerre mondiale
Pendant la Seconde Guerre mondiale, l’armée américaine a chargé le groupe de recherche statistique de l’université de Columbia de résoudre un problème urgent : trop de bombardiers américains ne revenaient pas de missions au-dessus de l’Europe. Les examens de l’avion qui est revenu ont révélé des dommages caractéristiques, avec des impacts de balle fortement concentrés sur le fuselage et les ailes. La conclusion évidente semblait être de renforcer ces zones fortement endommagées.
Mais le mathématicien Abraham Wald a vu le problème différemment. Il s’est rendu compte que l’armée ne s’intéressait qu’aux avions qui avaient survécu. Peu importe l’impact d’un avion, il ne pourrait revenir à la base que si aucun de ces coups n’était critique. Et les avions qui ne sont pas revenus ?
Loin de révéler des faiblesses à renforcer, les impacts de balles ont révélé les endroits où il était possible de survivre aux dégâts. Ils n’ont certainement pas révélé quels domaines étaient décisifs pour déterminer le succès ou la survie d’un bombardier.
Il s’agit probablement de l’exemple le plus célèbre de biais de survie : nous nous concentrons à tort sur les traits communs de ceux qui ont réussi (ou ont survécu) tout en ignorant les nombreux autres qui ont échoué, ce qui conduit à de fausses conclusions sur les aspects qui ont véritablement contribué à ce succès.
Le biais de survie est omniprésent autour de nous. Les articles citent les décrocheurs universitaires comme Bill Gates et Mark Zuckerberg comme preuve que les diplômes n’ont pas d’importance, tout en ignorant commodément le grand nombre de décrocheurs qui ne sont pas milliardaires. D’innombrables livres d’auto-assistance promettent de débloquer la formule de la gloire et de la fortune en documentant les habitudes des personnes qui réussissent – se réveiller à 5 heures du matin, méditer quotidiennement, prendre des douches froides – tout en ignorant les millions de personnes qui suivent des routines similaires et n’y parviennent jamais.
Dans la même veine, Perplexity et OpenAI semblent avoir examiné les géants de la technologie à succès qu’ils espèrent imiter un jour – Google, Microsoft et Apple – et ont décidé qu’un facteur commun à leur succès continu est qu’ils disposent chacun d’un navigateur propriétaire.
Quand l’imitation ressemble à de la perspicacité, mais ne l’est pas
L’année dernière, lorsqu’il est apparu brièvement que les régulateurs pourraient imposer des mesures structurelles à Google, y compris un désinvestissement, OpenAI et Perplexity ont exprimé leur sérieux intérêt pour l’achat du navigateur Chrome. Perplexity est même allé jusqu’à lancer une offre non sollicitée pour 34,5 milliards de dollars.
Malheureusement pour eux, même si le juge a imposé des sanctions et d’autres restrictions à Google, il n’a pas imposé de vente forcée de Chrome.
Il ne devrait donc pas être surprenant qu’Atlas et Comet semblent extrêmement familiers, d’autant plus qu’ils étaient tous deux en développement alors que l’affaire antitrust de Google se déroulait devant les tribunaux. C’est le plan B. Si vous ne pouvez pas acheter le navigateur, copiez-le.
OpenAI et Perplexity ont examiné l’expérience utilisateur bien établie de Chrome – avec sa barre d’adresse unifiée, ses onglets, ses extensions, etc. – et ont tout répliqué. Les deux navigateurs sont même construits sur Chromium, la technologie open source qui pilote Chrome.
Là encore, Microsoft l’a fait également lors de la création d’Edge. Et bien que Safari et Firefox ne soient pas basés sur Chromium, ils ont adopté de nombreuses fonctionnalités popularisées pour la première fois par Chrome.
Bien sûr, OpenAI et Perplexity ont chacun ajouté leur propre sauce secrète d’IA aux cloches et sifflets habituels. Les deux navigateurs sont conçus pour prendre en charge la « navigation agent », gérant tous ces clics et lectures apparemment fastidieux en votre nom. (Traitez-moi de démodé, mais j’aime surfer sur le Web. J’aime parcourir, découvrir et tomber sur des choses. J’aime lire un article bien écrit bien plus qu’un bref résumé des points clés.)
La navigation agent peut même rechercher et réserver des vacances, gérer votre courrier électronique et terminer vos achats, tout en faisant autre chose.
Le fait est que nous disposons déjà de l’IA agentique. Une grande partie de ce que ces nouveaux navigateurs peuvent faire se produit déjà lorsque vous utilisez ChatGPT ou Perplexity. C’est juste que cela s’est passé auparavant dans les coulisses.
Lorsque vous saisissez une requête ou une invite, le LLM utilise son navigateur sans tête pour effectuer une recherche sur le Web et trouver les informations requises pour générer une réponse précise. Ces nouveaux navigateurs agents rendent visible ce processus auparavant caché. Vous pouvez regarder le navigateur, par exemple, restructurer les données dans une feuille de calcul ou passer de page en page sur le site Web d’un supermarché, ajoutant des articles à votre panier prêts à être payés.
Ou, plus probablement, vous ferez probablement autre chose dans un autre onglet ou une autre fenêtre jusqu’à ce que le navigateur vous informe que la tâche est terminée, car qui a besoin de voir la saucisse en train d’être préparée ?
Problèmes de mesure, de fraude et de sécurité
Les sociétés d’IA espèrent clairement que la promesse de la navigation agentique attirera les gens vers Atlas ou Comet. Cependant, cela risque de créer de nombreux maux de tête pour les organisations.
Bien que le navigateur sans tête d’un LLM puisse s’identifier, par exemple, comme PerplexityBot lors de la visite de votre site Web, il n’en va pas de même lorsque le navigateur Comet de Perplexity visite votre site au nom d’un utilisateur. Pour votre outil d’analyse, il ressemble probablement à n’importe quel autre navigateur Chromium, avec l’adresse IP du visiteur. En d’autres termes, vous ne pourrez probablement pas savoir s’il s’agit d’un navigateur humain ou agent qui visite votre site.
Comme le souligne Digiday, cela crée tout un tas de problèmes pour les spécialistes du marketing et les référenceurs. Premièrement, vos mesures habituelles concernant le trafic et les clics deviennent moins fiables. Si vous ne pouvez pas le mesurer, vous ne pouvez pas le gérer.
Il existe ensuite un risque de fraude publicitaire massive. Si les publicités sont diffusées auprès d’agents IA plutôt que d’humains, qui peut le savoir ? Et avec des agents IA capables d’effectuer des milliers de requêtes par seconde, les choses pourraient devenir vraiment effrayantes.
Et puis il y a les implications en matière de sécurité.
Ces nouveaux navigateurs agents introduisent de nouveaux risques de sécurité importants. Gartner a recommandé aux entreprises de bloquer tous les navigateurs d’IA pour des raisons de cybersécurité, citant spécifiquement l’injection rapide comme un risque majeur.
L’année dernière, LayerX Security a inventé le terme CometJacking pour décrire une de ces techniques. En cliquant simplement sur un lien malveillant, l’utilisateur déclenche des commandes cachées qui demandent à l’IA de Comet d’accéder et de voler toutes les données sensibles exposées dans le navigateur. Les pirates n’ont pas besoin de phishing pour obtenir des mots de passe ou d’autres informations d’identification, car le navigateur a déjà autorisé l’accès à tout.
À peine trois semaines plus tard, LayerX a découvert une vulnérabilité dans Atlas qui pourrait également être exploitée par des acteurs malveillants pour injecter des instructions malveillantes dans la mémoire de ChatGPT.
À l’heure actuelle, demander à l’un de ces navigateurs de réserver des billets, d’effectuer des transactions ou de modifier des documents importants en mon nom ressemble moins à obtenir l’aide d’un assistant de confiance qu’à remettre vos clés à un parfait inconnu.
Quel problème ces nouveaux navigateurs résolvent-ils réellement ?
Mais cela ne veut pas dire que ces nouveaux navigateurs agents n’auront pas leur place. Même si une adoption généralisée semble peu probable, certaines équipes numériques pourraient néanmoins trouver une réelle valeur ajoutée en travaillant avec ces navigateurs agents.
Sans parler des tests manuels laborieux. Les développeurs et les testeurs UX pourraient utiliser ces navigateurs pour simuler les parcours des utilisateurs à grande échelle, testant ainsi la manière dont les sites Web réagissent dans différents scénarios de manière beaucoup plus efficace.
Les professionnels du référencement peuvent les utiliser pour comprendre comment les agents d’IA interprètent la structure du site et les pages Web, en fournissant des indices sur la façon dont le navigateur sans tête caché du LLM « voit » votre contenu et en soulignant les domaines dans lesquels des améliorations pourraient être apportées pour améliorer la visibilité.
Et pour les utilisateurs techniques habitués aux risques de sécurité, il ne fait aucun doute que les navigateurs agents offrent une automatisation véritablement utile pour les tâches répétitives, telles que l’extraction de données de plusieurs sources dans des feuilles de calcul ou la surveillance des modifications sur des sites Web spécifiques.
L’ironie est, bien sûr, que ces utilisateurs et développeurs expérimentés ne constituent absolument pas le bon public si OpenAI et Perplexity espèrent capturer une multitude de données utilisateur précieuses pour entraîner davantage leurs modèles. Ils ont besoin de données sur les modèles de comportement typiques des consommateurs, et non sur les workflows de test des développeurs.
Si Atlas et Comet veulent avoir une chance de se différencier des opérateurs historiques de Chrome, Safari, Edge, Firefox, etc., ils doivent offrir une proposition de valeur claire, attrayante et significative aux consommateurs moyens ; idéalement, un projet qui ne comporte pas de risques. Mais comme les principaux navigateurs ont également commencé à intégrer progressivement l’IA, cette proposition est loin d’être claire et toute différenciation risque d’être de courte durée.
Si l’IA doit transformer la façon dont la plupart des gens naviguent et interagissent avec Internet, ce ne sera pas grâce à Atlas ou Comet. Plus probablement, ce sera à cause de Chrome ou éventuellement d’Edge. Non seulement ces navigateurs ont déjà l’avantage d’être des opérateurs historiques de longue date, mais Google et Microsoft disposent également de leurs propres LLM propriétaires extrêmement puissants.
Firefox pourrait également valoir la peine d’être surveillé, car il lance de nouveaux contrôles d’IA conçus pour donner aux utilisateurs un contrôle bien plus grand sur les fonctionnalités d’IA qu’ils souhaitent utiliser ou bloquer. L’approche de Firefox pourrait nous donner l’image la plus claire à ce jour des types d’expériences basées sur l’IA que les utilisateurs souhaitent vraiment voir, au lieu de ce que les entreprises d’IA préféreraient.
La « guerre des navigateurs IA » vient à peine de commencer, et je ne pense pas qu’elle sera de courte durée. Cela ne va pas être une perturbation rapide, peu importe à quel point OpenAI et Perplexity aimeraient d’une manière ou d’une autre éviter des décennies de mandat et de confiance avec quelques démos flashy et un tas de prédictions optimistes. Au lieu de cela, les gagnants seront ceux qui se concentreront avant tout sur l’expérience utilisateur et sur cette proposition de valeur très importante. Quelle que soit la forme que prendra finalement l’IA ou la navigation agentique, nous saurons que la guerre est terminée lorsqu’elle disparaîtra si complètement dans les flux de travail des gens que plus personne n’y pensera.
Plus de ressources :