Le rôle de données structurées dans la visibilité de la recherche d'IA et d'IA

La façon dont les gens trouvent et consomment des informations ont changé. En tant que spécialistes du marketing, nous devons penser à la visibilité sur les plateformes d'IA et à Google.

Le défi est que nous n'avons pas la même capacité à contrôler et à mesurer le succès que nous le faisons avec Google et Microsoft, donc on a l'impression que nous volons aveugles.

Plus tôt cette année, Google, Microsoft et Chatgpt ont chacun commenté comment les données structurées peuvent aider les LLM à mieux comprendre votre contenu numérique.

Les données structurées peuvent donner aux outils d'IA le contexte dont ils ont besoin pour déterminer leur compréhension du contenu par le biais d'entités et de relations. Dans cette nouvelle ère de recherche, vous pourriez dire que le contexte, et non le contenu, est roi.

Le balisage du schéma aide à construire une couche de données

En traduisant votre contenu en schéma.org et en définissant les relations entre les pages et les entités, vous construisez une couche de données pour l'IA. Cette couche de données de balisage de schéma, ou comme j'aime appeler votre «graphique de connaissances de contenu», dit à Machines ce que votre marque est, ce qu'elle offre et comment elle devrait être comprise.

Cette couche de données est la façon dont votre contenu devient accessible et compris dans une gamme croissante de capacités d'IA, notamment:

Aperçu de l'IA
Chatbots et assistants vocaux
Systèmes d'IA internes

Grâce à la mise à la terre, les données structurées peuvent contribuer à la visibilité et à la découverte sur Google, Chatgpt, Bing et d'autres plateformes d'IA. Il prépare également vos données Web comme ultérieures pour accélérer votre interne Les initiatives de l'IA aussi.

La même semaine que Google et Microsoft ont annoncé qu'ils utilisaient des données structurées pour leurs expériences génératrices de l'IA, Google et OpenAI ont annoncé leur prise en charge du protocole de contexte du modèle.

Qu'est-ce que le protocole de contexte du modèle?

En novembre 2024, Anthropic a introduit le Protocole de contexte du modèle (MCP), «un protocole ouvert qui standardise comment les applications fournissent le contexte aux LLM» et ont ensuite été adoptées par OpenAI et Google Deepmind.

Vous pouvez considérer MCP comme le connecteur USB-C pour les applications et agents d'IA ou une API pour l'IA. «MCP fournit un moyen standardisé de connecter des modèles d'IA à différentes sources de données et outils.»

Étant donné que nous considérons maintenant les données structurées comme une couche de données stratégiques, le problème que Google et OpenAI ont besoin de résoudre est la façon dont ils évoluent leurs capacités d'IA efficacement et rentables. La combinaison de données structurées que vous mettez sur votre site Web, avec MCP, permettrait une précision de l'inférence et la possibilité de mettre à l'échelle.

Les données structurées définissent les entités et les relations

Les LLMS génèrent des réponses en fonction du contenu auquel ils sont formés ou connectés. Bien qu'ils apprennent principalement du texte non structuré, leurs résultats peuvent être renforcés lorsqu'ils sont mis à la terre dans des entités et des relations clairement définies, par exemple, via des données structurées ou des graphiques de connaissances.

Les données structurées peuvent être utilisées comme activateur qui permet aux entreprises de définir les entités clés et leurs relations.

Lorsqu'il est implémenté à l'aide du vocabulaire schema.org, des données structurées:

Définit les entités sur une page: personnes, produits, services, lieux, etc.
Établit des relations entre ces entités.
Peut réduire les hallucinations Lorsque les LLM sont fondées sur des données structurées via des systèmes de récupération ou des graphiques de connaissances.

Lorsque le balisage du schéma est déployé à grande échelle, il construit un graphique de connaissances de contenu, une couche de données structurée qui relie les entités de votre marque sur votre site et au-delà.

Une étude récente de BrightEdge a démontré que le balisage du schéma a amélioré la présence et la perception de la marque dans les aperçus de l'IA de Google, notant des taux de citation plus élevés sur les pages avec un balisage de schéma robuste.

Données structurées en tant que stratégie d'IA d'entreprise

Les entreprises peuvent déplacer leur vision des données structurées au-delà des exigences de base pour une riche éligibilité à la gestion d'un graphique de connaissances de contenu.

Selon les mandats d'IA de Gartner en 2024 pour l'enquête sur les entreprises, les participants citent la disponibilité et la qualité des données comme obstacle supérieur à une mise en œuvre réussie de l'IA.

En implémentant des données structurées et en développant un graphique de connaissances de contenu robuste, vous pouvez contribuer à la fois aux performances de recherche externes et à l'activation IA interne.

Une stratégie de balisage de schéma évolutif nécessite:

Relations définies entre le contenu et les entités: Les propriétés de balisage de schéma connectent tous les contenus et entités à travers la marque. Tout le contenu de la page est connecté dans le contexte.
Gouvernance de l'entité: Définitions et taxonomies partagées dans les équipes de marketing, de référencement, de contenu et de produit.
Préparation au contenu: Assurer que votre contenu est complet, pertinent, représentatif des sujets pour lesquels vous souhaitez être connu et connecté à votre graphique de connaissances de contenu.
Capacité technique: Outils et processus interfonctionnels pour gérer le balisage du schéma à grande échelle et assurer la précision sur des milliers de pages.

Pour les équipes d'entreprise, les données structurées sont une capacité interfonctionnelle qui prépare les données Web à consommer par des applications d'interface utilisateur internes.

Que faire ensuite pour préparer votre contenu pour l'IA

Les équipes d'entreprise peuvent aligner leurs stratégies de contenu avec les exigences de l'IA. Voici comment commencer:

1. Audit vos données structurées actuelles Pour identifier les lacunes dans la couverture et si le balisage du schéma définit les relations dans votre site Web. Ce contexte est essentiel à l'inférence de l'IA.

2. Carte les entités clés de votre marquetels que les produits, les services, les personnes et les sujets de base, et s'assurent qu'ils sont clairement définis et cohérentes avec le balisage des schémas dans votre contenu. Cela comprend l'identification de la page principale qui définit une entité, connue sous le nom d'entité.

3. Créez ou développez votre graphique de connaissances de contenu En connectant les entités liées et en établissant des relations que les systèmes d'IA peuvent comprendre.

4. Intégrer les données structurées dans le budget et la planification de l'IAaux côtés d'autres investissements en IA et ce contenu est destiné aux aperçus de l'IA, aux chatbots ou aux initiatives internes d'IA.

5. Opérationnaliser la gestion du balisage des schéma En développant des workflows reproductibles pour la création, l'examen et la mise à jour du balisage du schéma à grande échelle.

En prenant ces mesures, les entreprises peuvent s'assurer que leurs données sont prêtes à être prêtes à AI, à l'intérieur et à l'extérieur de l'entreprise.

Les données structurées fournissent une couche lisible par machine

Les données structurées n'assurent pas le placement dans les aperçus d'IA ou ne contrôlent directement ce que les modèles de langue importants disent de votre marque. Les LLM sont toujours principalement formées sur du texte non structuré, et les systèmes d'IA pèsent de nombreux signaux lors de la génération de réponses.

Quelles données structurées fait fournir est une couche stratégique et lisible par machine. Lorsqu'il est utilisé pour construire un graphique de connaissances, le balisage du schéma définit les entités et les relations entre eux, créant un cadre fiable à partir duquel les systèmes d'IA peuvent tirer. Cela réduit l'ambiguïté, renforce l'attribution et facilite les sorties de mise à la terre dans le contenu basé sur les faits lorsque les données structurées font partie d'un système de récupération ou de mise à la terre connecté.

En investissant dans un balisage de schéma sémantique et à grande échelle et en l'alignant entre les équipes, les organisations se positionnent aussi découvrables dans les expériences d'IA que possible.

Plus de ressources: