Il a été rapporté qu’OpenAI travaillait sur un moteur de recherche qui défierait directement Google. Mais les détails absents du rapport soulèvent la question de savoir si OpenAI crée un moteur de recherche autonome ou s’il existe une autre raison pour cette annonce.
Rapport de recherche sur le Web OpenAI
Le rapport publié sur The Information rapporte qu’OpenAI développe un produit de recherche sur le Web qui concurrencera directement Google. Un détail clé du rapport est qu’il sera en partie alimenté par Bing, le moteur de recherche de Microsoft. En dehors de cela, il n’y a pas d’autres détails, notamment s’il s’agira d’un moteur de recherche autonome ou s’il sera intégré à ChatGPT.
Tous les rapports indiquent que ce sera un défi direct pour Google, alors commençons par là.
1. OpenAI constitue-t-il un défi pour Google ?
OpenAI utiliserait la recherche Bing dans le cadre du moteur de recherche supposé, une combinaison d’un GPT-4 avec Bing Search, plus quelque chose au milieu pour coordonner les deux.
Dans ce scénario, OpenAI ne développe pas sa propre technologie d’indexation de recherche, mais utilise Bing.
Ce qu’il reste alors à OpenAI pour créer un moteur de recherche est de concevoir comment l’interface de recherche interagit avec GPT-4 et Bing.
Et c’est un problème que Bing a déjà résolu en utilisant ce que Microsoft appelle une couche d’orchestration. Bing Chat utilise la génération augmentée par récupération (RAG) pour améliorer les réponses en ajoutant des données de recherche sur le Web à utiliser comme contexte pour les réponses créées par GPT-4. Pour plus d’informations sur le fonctionnement de l’orchestration et de RAG, regardez le discours d’ouverture de l’événement Microsoft Build 2023 prononcé par Kevin Scott, directeur de la technologie chez Microsoft, à 31 min 45 s ici).
Si OpenAI crée un défi pour la recherche Google, que reste-t-il exactement à OpenAI pour faire ce que Microsoft ne fait pas déjà avec Bing Chat ? Bing est une technologie de recherche expérimentée et mature, une expertise que OpenAI ne possède pas.
OpenAI défie-t-il Google ? Une réponse plus plausible est que Bing défie Google via OpenAI en tant que proxy.
2. OpenAI a-t-il l’élan nécessaire pour défier Google ?
ChatGPT est l’application à la croissance la plus rapide de tous les temps, avec actuellement environ 180 millions d’utilisateurs, réalisant en deux mois ce qui a pris des années pour Facebook et Twitter.
Pourtant, malgré cette longueur d’avance, l’avance de Google reste une pente raide à gravir pour OpenAI. Considérez que Google compte environ 3 à 4 milliards d’utilisateurs dans le monde, ce qui éclipse absolument les 180 millions d’OpenAI.
En supposant que les 180 millions d’utilisateurs d’OpenAI effectuent en moyenne 4 recherches par jour, le nombre quotidien de recherches pourrait atteindre 720 millions de recherches par jour.
Statista estime qu’il y a 6,3 millions de recherches sur Google par minute, ce qui équivaut à plus de 9 milliards de recherches par jour.
Si OpenAI veut être compétitif, il devra proposer un produit utile avec une raison impérieuse de l’utiliser. Par exemple, Google et Apple disposent d’un écosystème d’audience captive sur les appareils mobiles qui les intègre dans la vie quotidienne de leurs utilisateurs, tant au travail qu’à la maison. Il est évident qu’il ne suffit pas de créer un moteur de recherche pour être compétitif.
De manière réaliste, comment OpenAI peut-il atteindre ce niveau d’ubiquité et d’utilité ?
OpenAI est confronté à une bataille difficile non seulement contre Google, mais aussi contre Microsoft et Apple. Si nous comptons les applications et les appareils de l’Internet des objets, ajoutez Amazon à cette liste de concurrents déjà présents dans la vie quotidienne de milliards d’utilisateurs.
OpenAI n’a pas l’élan nécessaire pour lancer un moteur de recherche pour concurrencer Google car il ne dispose pas de l’écosystème nécessaire pour prendre en charge l’intégration dans la vie des utilisateurs.
3. OpenAI manque d’expertise en matière de recherche d’informations
La recherche est officiellement appelée recherche d’informations (RI) dans les articles de recherche et les brevets. Aucune recherche dans le référentiel d’articles de recherche Arxiv.org ne fera apparaître des articles rédigés par des chercheurs d’OpenAI liés à la recherche d’informations. La même chose peut être dite pour la recherche de brevets liés à la recherche d’informations (RI). La liste des articles de recherche d’OpenAI manque également d’études liées aux RI.
Ce n’est pas qu’OpenAI soit secret. OpenAI publie depuis longtemps des articles de recherche sur les technologies qu’elle développe. La recherche sur l’IR n’existe pas. Alors si OpenAI envisage effectivement de lancer un défi à Google, où est la fumée de cet incendie ?
Il est raisonnable de supposer que la recherche n’est pas quelque chose qu’OpenAI développe actuellement. Rien n’indique qu’il flirte avec la création d’un moteur de recherche, il n’y a rien là-dedans.
4. Le moteur de recherche OpenAI est-il un projet Microsoft ?
Il existe des preuves substantielles que Microsoft recherche furieusement comment utiliser les LLM dans le cadre d’un moteur de recherche.
Tous les articles de recherche suivants sont classés comme appartenant aux domaines de la recherche d’informations (alias recherche), de l’intelligence artificielle et du calcul du langage naturel.
Voici quelques articles de recherche datant uniquement de 2024 :
Améliorer l’annotation humaine : tirer parti de grands modèles de langage et d’un traitement par lots efficace
Il s’agit d’utiliser l’IA pour classer les requêtes de recherche.
Extraction d’entités structurées à l’aide de grands modèles de langage
Ce document de recherche découvre un moyen d’extraire des informations structurées à partir de textes non structurés (comme des pages Web). C’est comme transformer une page Web (données non structurées) en un format compréhensible par machine (données structurées).
Amélioration des intégrations de texte avec de grands modèles de langage (version PDF ici)
Ce document de recherche discute d’un moyen d’obtenir des intégrations de texte de haute qualité pouvant être utilisées pour la recherche d’informations (RI). L’incorporation de texte fait référence à la création d’une représentation de texte d’une manière qui peut être utilisée par des algorithmes pour comprendre les significations sémantiques et les relations entre les mots.
Le document de recherche ci-dessus explique l’utilisation :
« Les intégrations de texte sont des représentations vectorielles du langage naturel qui codent ses informations sémantiques. Ils sont largement utilisés dans diverses tâches de traitement du langage naturel (NLP), telles que la recherche d’informations (IR), la réponse à des questions… etc. Dans le domaine des RI, la récupération de première étape repose souvent sur l’incorporation de texte pour rappeler efficacement un petit ensemble de documents candidats à partir d’un corpus à grande échelle en utilisant des techniques de recherche approximative du voisin le plus proche.
Il existe d’autres recherches menées par Microsoft sur la recherche, mais ce sont celles qui sont spécifiquement liées à la recherche avec de grands modèles de langage (comme GPT-4.5).
Suivre le fil d’Ariane mène directement à Microsoft en tant que technologie alimentant tout moteur de recherche qu’OpenAI est censé planifier… si cette rumeur est vraie.
5. La rumeur est-elle destinée à voler la vedette aux Gémeaux ?
La rumeur selon laquelle OpenAI lancerait un moteur de recherche concurrent a été publiée le 14 février. Le lendemain, le 15 février, Google a annoncé le lancement de Gemini 1.5, après avoir annoncé Gemini Advanced le 8 février.
Est-ce une coïncidence si l’annonce d’OpenAI a complètement éclipsé l’annonce de Gemini le lendemain ? Le timing est incroyable.
À ce stade, le moteur de recherche OpenAI n’est qu’une rumeur.