Microsoft a annoncé Web IQ, un ensemble d’API de base qui permettent aux agents d’IA d’extraire des informations de l’index de recherche de Bing.
La société appelle Web IQ « un moteur de recherche pour les systèmes d’IA ». Là où Bing aide les gens à trouver des pages Web, Web IQ aide les agents d’IA à trouver des informations qu’ils peuvent utiliser tout en raisonnant sur une tâche.
Ce que fait Web IQ
Web IQ utilise une pile de récupération reconstruite basée sur l’index Bing, repensant la façon dont le contenu est indexé, classé et sélectionné. Les agents IA effectuent des recherches répétées dans des délais serrés et en plusieurs étapes.
L’API renvoie des passages et des « objets de preuve structurés » au lieu de pages Web complètes, de sorte que les modèles d’IA ne reçoivent que les parties utiles d’une page. Chaque jeton traité par un modèle d’IA coûte de l’argent et ajoute de la latence. Ainsi, moins de jetons avec de meilleures informations signifient des réponses moins chères et plus rapides.
Microsoft le résume ainsi : « moins de jetons entrants, de meilleures réponses, un coût par appel inférieur ».
Allégations de performance
Microsoft utilise GDSAT (grounding satisfaction) pour mesurer si les informations sont récentes et dignes de confiance. Ils affirment que Web IQ obtient des scores supérieurs à ceux de leurs concurrents sur la base de 3 000 exemples de requêtes.
La société rapporte des temps de réponse inférieurs à 165 ms à P95, près de 2,5 fois plus rapides que ceux de ses concurrents, sur la base de tests effectués dans cinq centres de données.
Concernant l’efficacité des jetons, Microsoft rapporte que Web IQ offre la même qualité avec moins de jetons à mesure que le volume de résultats augmente.
Contrôles de l’éditeur
Web IQ suit les mêmes règles d’exclusion de robots et préférences d’éditeur que celles que Bing honore déjà. La société travaille également avec l’IETF et d’autres groupes industriels sur des normes sur la manière dont les systèmes d’IA accèdent au contenu Web.
Détails techniques
Web IQ utilise le modèle d’intégration open source de Microsoft pour trouver du contenu pertinent et des modèles supplémentaires pour classer et sélectionner les passages.
Selon l’annonce, ces modèles sont formés pour la manière dont ils seront utilisés dans le raisonnement de l’IA, et non pour des scores de référence autonomes.
Pour une recherche rapide à grande échelle, le système étend DiskANN, la technologie de Microsoft permettant de rechercher des index volumineux sans tout charger en mémoire.
Pourquoi c’est important
Microsoft a travaillé dans ce sens. Bing Webmaster Tools a ajouté des données de citation IA en février, mappé les requêtes de base aux pages citées en mars et présenté un aperçu du partage de citations lors de la SEO Week. Ces outils montrent aux éditeurs comment les systèmes d’IA utilisent leur contenu, et Web IQ en est l’autre aspect. C’est ce que les systèmes d’IA utiliseraient en premier lieu pour extraire le contenu.
Dans Web IQ, les informations sont renvoyées sous forme de passages plutôt que de pages complètes. Ce qui fait qu’une page est bien classée dans la recherche traditionnelle et ce qui rend un passage utile pour la mise à la terre peuvent ne pas se chevaucher, comme l’a décrit le propre article sur le cadre de mise à la terre de Microsoft plus tôt cette année.
Regarder vers l’avenir
Web IQ accepte les manifestations d’intérêt mais n’a pas annoncé sa disponibilité générale, ses prix ni les plates-formes d’IA qui l’utiliseront. Microsoft n’a pas précisé si la mise à la terre existante de Copilot ou Bing Chat utilise Web IQ, ou si Web IQ est distinct de ces systèmes.