Le brevet « Branded Search » de Google pour le classement des résultats de recherche

En 2012, Google a déposé un brevet intitulé « Ranking Search Results » qui montre comment Google peut utiliser les requêtes de recherche de marque comme facteur de classement. Le brevet concerne l'utilisation des requêtes de recherche de marque et des requêtes de navigation comme facteurs de classement, ainsi qu'un décompte des liens indépendants. Bien que ce brevet date de 2012, il est possible qu'il puisse encore jouer un rôle dans le classement.

Le brevet a été mal compris par la communauté du marketing de recherche en 2012 et les connaissances qu’il contenait ont été perdues.

En quoi consiste le brevet sur les résultats de recherche de classement ? TL/DR

Le brevet concerne explicitement une invention permettant de classer les résultats de recherche, c'est pourquoi le brevet s'appelle « Classement des résultats de recherche ». Le brevet décrit un algorithme qui utilise deux facteurs de classement pour reclasser les pages Web :

Facteur de tri 1:Par nombre de liens entrants indépendants
Il s'agit d'un décompte des liens indépendants du site classé.

Facteur de tri 2 : Par nombre de requêtes de recherche de marque et de requêtes de recherche de navigation.
Les requêtes de recherche de marque et de navigation sont appelées « requêtes de référence » et sont également appelées liens implicites.

Les comptages des deux facteurs sont utilisés pour modifier le classement des pages Web.

Pourquoi le brevet a été mal compris TL/DR

Tout d'abord, je tiens à préciser qu'en 2012, je ne savais pas comment lire les brevets. J'étais plus intéressé par les articles de recherche et je laissais la lecture des brevets à d'autres. Lorsque je dis que tout le monde dans la communauté du marketing de recherche a mal compris le brevet, je m'inclus dans ce groupe.

Le brevet « Ranking Search Results » a été publié en 2012, un an après la sortie d’une mise à jour de la qualité du contenu appelée Panda Update. La mise à jour Panda doit son nom à l’un des ingénieurs qui y ont travaillé, Navneet Panda. Navneet Panda a élaboré des questions que des évaluateurs de qualité tiers ont utilisées pour évaluer les pages Web. Ces évaluations ont été utilisées comme test pour voir si les modifications apportées à l’algorithme parvenaient à supprimer le contenu de la « ferme de contenu ».

Navneet Panda est également co-auteur du brevet « Classement des résultats de recherche ». Les spécialistes du référencement ont vu son nom sur le brevet et ont immédiatement supposé qu’il s’agissait du brevet de Panda.

La raison pour laquelle cette hypothèse est fausse est que la mise à jour Panda est un algorithme qui utilise un « classificateur » pour classer les pages Web en fonction de la qualité de leur contenu. Le brevet « Ranking Search Results » concerne le classement des résultats de recherche, point final. Le brevet Ranking Search Results ne concerne pas la qualité du contenu et ne comporte pas de classificateur de qualité du contenu.

Rien dans le brevet « Classement des résultats de recherche » n’a de rapport de quelque manière que ce soit avec la mise à jour Panda.

Pourquoi ce brevet n'est pas la mise à jour de Panda

En 2009, Google a publié la mise à jour Caffeine qui lui a permis d'indexer rapidement du contenu nouveau, mais a créé par inadvertance une faille qui a permis aux fermes de contenu de classer des millions de pages Web sur des sujets rarement recherchés.

Dans une interview avec Wired, l'ancien ingénieur de recherche de Google, Matt Cutts, a décrit les fermes de contenu comme suit :

« C'était comme si on se demandait quel était le minimum que je pouvais faire pour ne pas être du spam. » Cela s'est passé entre nos deux groupes respectifs. Et puis nous avons décidé que nous devions nous réunir et trouver un moyen de régler ce problème. »

Google a ensuite réagi avec la mise à jour Panda, du nom d'un ingénieur de recherche qui a travaillé sur l'algorithme spécialement conçu pour filtrer le contenu des fermes de contenu. Google a fait appel à des évaluateurs de qualité de site tiers pour évaluer les sites Web et les commentaires ont été utilisés pour créer une nouvelle définition de la qualité du contenu qui a été utilisée contre le contenu des fermes de contenu.

Matt Cutts a décrit le processus :

« Un ingénieur a élaboré une série de questions rigoureuses, allant de : « Considérez-vous que ce site fait autorité ? Serait-il acceptable que ce site soit publié dans un magazine ? Ce site contient-il trop de publicités ? » Des questions du même genre.

… nous avons en fait mis au point un classificateur qui permet de dire, d’accord, l’IRS ou Wikipédia ou le New York Times sont de ce côté-ci, et les sites de mauvaise qualité sont de ce côté-là. Et on peut vraiment voir les raisons mathématiques… »

En termes simples, un classificateur est un algorithme au sein d'un système qui catégorise les données. Dans le contexte de la mise à jour Panda, le classificateur catégorise les pages Web en fonction de la qualité du contenu.

Ce qui apparaît à la lecture du brevet « Classement des résultats de recherche », c'est qu'il ne s'agit clairement pas de la qualité du contenu, mais du classement des résultats de recherche.

Signification des liens explicites et des liens implicites

Le brevet « Classement des résultats de recherche » utilise deux types de liens pour modifier les résultats de recherche classés :

Liens implicites
Liens express

Liens implicites :
Le brevet utilise des requêtes de recherche de marque et des requêtes de navigation pour calculer un score de classement comme si les requêtes de marque/de navigation étaient des liens, en les appelant des liens implicites. Les liens implicites sont utilisés pour créer un facteur de modification des pages Web qui sont pertinentes (réactives) aux requêtes de recherche.

Liens express :
Le brevet utilise également des liens entrants indépendants vers la page Web dans le cadre d'un autre calcul pour trouver un facteur de modification des pages Web qui répondent à une requête de recherche.

Ces deux types de liens (liens implicites et liens explicites indépendants) sont utilisés comme facteurs pour modifier le classement d'un groupe de pages Web.

Il est simple de comprendre de quoi parle le brevet, car le début du brevet l’explique dans un anglais relativement facile à comprendre.

Cette section du brevet utilise le jargon suivant :

Une ressource est une page Web ou un site Web.
Une cible (ressource cible) est ce à quoi on fait référence ou qui est lié.
Une « ressource source » est une ressource qui fait une citation vers la « ressource cible ».
Le mot « groupe » désigne le groupe de pages Web qui sont pertinentes pour une requête de recherche et qui sont classées.

Le brevet parle de « liens express », qui sont simplement des liens ordinaires. Il décrit également des « liens implicites », qui sont des références dans les requêtes de recherche, des références à une page Web (appelée « ressource cible »).

Je vais ajouter des puces aux phrases originales afin qu'elles soient plus faciles à comprendre.

Ok, donc voici la première partie importante :

« Les liens vers le groupe peuvent inclure des liens explicites, des liens implicites ou les deux.

Un lien express, par exemple un lien hypertexte, est un lien inclus dans une ressource source qu'un utilisateur peut suivre pour accéder à une ressource cible.

Un lien implicite est une référence à une ressource cible, par exemple une citation vers la ressource cible, qui est incluse dans une ressource source mais qui n'est pas un lien explicite vers la ressource cible. Ainsi, une ressource du groupe peut être la cible d'un lien implicite sans qu'un utilisateur puisse accéder à la ressource en suivant le lien implicite.

La deuxième partie importante utilise le même jargon pour définir ce que sont les liens implicites :

Une ressource est une page Web ou un site Web.
Le site vers lequel le lien est établi ou auquel il fait référence est appelé une « ressource cible ».
Un « groupe de ressources » désigne un groupe de pages Web.

Voici comment le brevet explique les liens implicites :

« Une requête peut être classée comme faisant référence à une ressource particulière si la requête inclut un terme reconnu par le système comme faisant référence à la ressource particulière.

Par exemple, un terme qui fait référence à une ressource peut être la totalité ou une partie d'un identifiant de ressource, par exemple l'URL, pour la ressource.

Par exemple, le terme « exemple.com » peut être un terme reconnu comme faisant référence à la page d’accueil de ce domaine, par exemple, la ressource dont l’URL est « http://www.exemple.com ».

Ainsi, les requêtes de recherche incluant le terme « exemple.com » peuvent être classées comme faisant référence à cette page d’accueil.

À titre d’exemple, si le système dispose de données indiquant que les termes « example sf » et « esf » sont couramment utilisés par les utilisateurs pour faire référence à la ressource dont l’URL est « http://www.sf.example.com », les requêtes qui contiennent les termes « example sf » ou « esf », par exemple les requêtes « example sf news » et « esf restaurant reviews », peuvent être comptées comme des requêtes de référence pour le groupe qui inclut la ressource dont l’URL est « http://www.sf.example.com ».

L'explication ci-dessus définit les « requêtes de référence » comme les termes que les gens utilisent pour faire référence à un site Web spécifique. Ainsi, par exemple (mon exemple), si les gens effectuent une recherche en utilisant « Walmart » avec le mot clé Climatiseur dans leur requête de recherche, alors la requête « Walmart » + Climatiseur est comptabilisée comme une « requête de référence » vers Walmart.com, elle est comptabilisée comme une citation et un lien implicite.

Le brevet ne concerne pas les « mentions de marque » sur les pages Web

Certains spécialistes du référencement pensent que la mention d'une marque sur une page Web est comptabilisée par Google comme s'il s'agissait d'un lien. Ils ont mal interprété ce brevet pour soutenir la croyance selon laquelle un « lien implicite » est une mention de marque sur une page Web.

Comme vous pouvez le constater, le brevet ne décrit pas l'utilisation de « mentions de marque » sur les pages Web. Il est clair que la signification de « liens implicites » dans le contexte de ce brevet concerne les références à des marques dans les requêtes de recherche, et non sur une page Web.

Il explique également comment faire la même chose avec les requêtes de navigation :

« De plus ou en variante, une requête peut être catégorisée comme faisant référence à une ressource particulière lorsque la requête a été déterminée comme étant une requête de navigation vers la ressource particulière. Du point de vue de l'utilisateur, une requête de navigation est une requête qui est soumise afin d'accéder à un site Web ou à une page Web unique et particulier d'une entité particulière. Le système peut déterminer si une requête est de navigation vers une ressource en accédant aux données qui identifient les requêtes classées comme de navigation vers chacune d'un certain nombre de ressources. »

Le point à retenir est que le parent décrit l'utilisation de « requêtes de référence » (requêtes de recherche de marque/de navigation) comme un facteur similaire aux liens et c'est pourquoi elles sont appelées liens implicites.

Facteur de modification

L'algorithme génère un « facteur de modification » qui reclasse (modifie) un groupe de pages Web pertinentes pour une requête de recherche en fonction des « requêtes de référence » (qui sont des requêtes de recherche de marque) et en utilisant également un nombre de liens entrants indépendants.

Voici comment se fait la modification (ou le classement) :

Un décompte des liens entrants utilisant uniquement des liens « indépendants » (liens qui ne sont pas contrôlés par le site vers lequel le lien est établi).
Un décompte est effectué des requêtes de référence (requêtes de recherche de marque) (auxquelles on attribue un pouvoir de classement comme un lien).

Rappel: « ressources » est une référence aux pages Web et aux sites Web.

Voici comment le brevet explique la partie concernant le classement :

« Le système génère un facteur de modification pour le groupe de ressources à partir du nombre de liens indépendants et du nombre de requêtes de référence… Par exemple, le facteur de modification peut être un rapport entre le nombre de liens indépendants pour le groupe et le nombre de requêtes de référence pour le groupe. »

Ce que fait le brevet, c'est qu'il filtre les liens afin d'utiliser des liens qui ne sont pas associés au site Web et il compte également le nombre de requêtes de recherche de marque effectuées pour une page Web ou un site Web et l'utilise comme facteur de classement (facteur de modification).

Rétrospectivement, ce fut une erreur de la part de certains acteurs du secteur du référencement d’utiliser ce brevet comme « preuve » de leur idée selon laquelle les mentions de marque sur les sites Web étaient un facteur de classement.

Il est clair que les « liens implicites » ne concernent pas les mentions de marque dans les pages Web en tant que facteur de classement, mais plutôt les mentions de marque (et les URL et domaines) dans les requêtes de recherche qui peuvent être utilisées comme facteurs de classement.

Pourquoi ce brevet est important

Ce brevet décrit une méthode permettant d'utiliser les requêtes de recherche de marque comme un signal de popularité et de pertinence pour le classement des pages Web. C'est un bon signal car ce sont les utilisateurs eux-mêmes qui disent qu'un site Web spécifique est pertinent pour des requêtes de recherche spécifiques. C'est un signal difficile à manipuler, ce qui peut en faire un signal propre et non spam.

Nous ne savons pas si Google utilise ce qui est décrit dans le brevet. Mais il est facile de comprendre pourquoi cela pourrait encore être un signal pertinent aujourd'hui.

Lire le brevet dans son contexte complet

Les brevets utilisent un langage spécifique et il est facile de mal interpréter les mots ou d'en négliger le sens en se concentrant sur des phrases spécifiques. La plus grande erreur que je vois commettre par les référenceurs est de supprimer une ou deux phrases de leur contexte, puis de les utiliser pour dire que Google fait telle ou telle chose. C'est ainsi que commence la désinformation en matière de référencement.

Lisez mon article sur Comment lire les brevets de Google pour comprendre comment les lire et éviter de les mal interpréter. Même si vous ne lisez pas les brevets, il est utile de connaître les informations, car cela vous permettra de repérer plus facilement les fausses informations sur les brevets, qui sont nombreuses en ce moment.

Je me suis limité dans cet article à expliquer ce qu'est le brevet « Classement des résultats de recherche » et quels en sont les points les plus importants. Il contient de nombreux détails précis sur les différentes implémentations que je ne couvre pas car ils ne sont pas nécessaires à la compréhension du brevet lui-même.

Si vous souhaitez connaître les détails précis, je vous encourage vivement à lire d’abord mon article sur la façon de lire les brevets avant de lire le brevet.

Lire le brevet ici :

Classement des résultats de recherche