Google clarifie le fonctionnement du système de contenu utile

Google SearchLiaison a clarifié un passage déroutant dans ses conseils sur le système de contenu utile qui semblait potentiellement susceptible de causer des problèmes par inadvertance à des éditeurs innocents.

Système de contenu utile

Le système de contenu utile de Google est basé sur un modèle d’apprentissage automatique qui utilise des classificateurs pour générer un signal qui est ensuite utilisé par le système de classement de Google pour éliminer le contenu de mauvaise qualité.

Un classificateur est un algorithme dans un modèle d’apprentissage automatique qui attribue une étiquette à une entrée. Dans le contexte du système de contenu utile, le modèle d’apprentissage automatique attribue une étiquette au contenu du site Web, qui génère à son tour un signal, comme un pouce vers le bas.

Ce signal est également pondéré, ce qui signifie qu’un site avec juste un peu de contenu inutile obtient une note plus faible qu’un site avec beaucoup de contenu inutile qui obtiendrait une note plus négative.

Le système de contenu utile génère un signal, qui est l’un des centaines ou des milliers d’autres signaux utilisés pour classer un site (comme les liens, la pertinence, etc.).

Guide Google involontairement opaque

Google a mis à jour ses conseils pour le système de contenu utile lors du dernier système de contenu utile afin de contribuer à clarifier ce qu’était ce signal afin que les éditeurs et les référenceurs puissent comprendre pourquoi les sites ont perdu leur classement.

Le mot « opaque » signifie quelque chose qui manque de clarté ou de transparence. Et malheureusement, une partie de ces orientations semblait involontairement opaque et, par conséquent, prête à confusion.

Voici le passage en question :

« Changez-vous la date des pages pour leur donner un aspect frais alors que le contenu n’a pas substantiellement changé ? »

Ce passage s’adresse à certains utilisateurs qui tentent de jouer avec l’algorithme de fraîcheur de Google en apportant une modification relativement triviale au contenu, puis en mettant à jour la date de publication afin de faire croire à Google que l’ancien contenu est une page Web récemment publiée.

Mais le problème est que de nombreuses personnes reviennent sur une page Web et apportent des modifications mineures au contenu pour :

  • Corriger les fautes de frappe
  • Remplacez ou ajoutez un mot pour le rendre grammaticalement correct ou plus clair
  • Changer les mots pour rendre le contenu plus clair

De nombreuses personnes apportent de nombreuses modifications légitimes mais mineures au contenu.

Les directives qui interdisaient apparemment d’apporter de petites modifications entraînant des changements de date ont créé une situation dans laquelle une petite amélioration pouvait désormais contribuer à une évaluation négative par le système de contenu utile.

C’est exactement le problème signalé sur X (anciennement Twitter).

Luc Jordan (@lr_jordan) ont partagé leur inquiétude légitime:

« Google ne comprend pas assez bien les nuances pour établir des règles générales

Il punit les sites Web qui utilisent une date de « dernière mise à jour » pour de « petites » modifications.

Mais dans les jeux, un correctif/une mise à jour pourrait être aussi simple qu’une mise à niveau qui coûtait 5 points en coûte désormais 6.

Et cette petite augmentation pourrait changer beaucoup de choses quant à son utilité.

Les utilisateurs voudront savoir que la publication est à jour et donc pertinente, ils feront donc référence à la date et au numéro de patch.

Une mise à jour véritablement utile peut nécessiter de changer le numéro 6 en 5 et un numéro de correctif de 9.0.1 à 9.0.2.

Si la date indique que le guide a été mis à jour pour la dernière fois il y a 6 mois, cela n’a aucun sens.

De plus, la date (largement obsolète) apparaît dans les résultats de Google, de sorte que les gens cliquent beaucoup moins dessus, le CTR étant un autre facteur de classement.

Bien sûr, ils peuvent simplement prétendre qu’ils comprennent tout cela et être super serviables gagnera toujours ! »

Google SearchLiaison a répondu:

« Non, nous ne faisons pas cela si les mises à jour sont faites pour être utiles aux gens.

Ce n’est pas quelque chose que nous disons.

Pas dans nos directives.

SearchLiaison est correct, mais en raison de l’opacité de ce passage, il semble dire ce que Luke Jordan dit que cela signifie.

Luc suivi avec:

« Donc, pour confirmer, savez-vous si un seul changement de caractère dans un article est conçu pour être utile aux gens ? »

Il y a un message supplémentaire de Lukeaccompagné d’une capture d’écran du passage dans la guidance :

« Parce que vos directives stipulent littéralement que vous ne devez pas modifier la date des pages lorsque le contenu n’a pas substantiellement changé. »

RechercheLiaison a répondu:

« Le contexte de ces questions est de savoir si vous faites quelque chose pour Google.

Si vous changez simplement la date parce que vous pensez « cela fera penser à Google que c’est nouveau », vous vous alignez probablement sur d’autres comportements qui correspondent globalement aux signaux que nous utilisons pour identifier l’utilité du contenu.

Ce n’est pas qu’une seule chose. Ce n’est pas direct.

Et ce n’est pas un problème si vous ne faites pas les choses principalement pour Google. »

S’aligner sur d’autres comportements

Quelle RechercheLiaison apparaît Ce que je veux dire, c’est que la tactique de changement de date n’est qu’une des nombreuses tactiques utilisées par le modèle d’apprentissage automatique pour calculer la probabilité statistique que la page Web utilise des tactiques de référencement pour Google au lieu de faire quelque chose pour créer un contenu utile et utile.

Il y a un problème avec les statistiques : si vous utilisez une seule mesure de manière isolée, le modèle statistique prendra de mauvaises décisions.

C’est pourquoi, dans les modèles statistiques liés à la recherche, il est bien documenté que l’utilisation conjointe de plusieurs signaux pour calculer la probabilité statistique est plus précise que l’utilisation d’un seul signal (métrique).

Si vous débutez dans ce domaine, consultez ce PDF d’un système d’identification statistique du spam qui combine plusieurs fonctionnalités telles que les mesures sur la page, hors page et l’interaction de l’utilisateur pour déterminer si une page Web est du spam ou non.

Je ne veux pas mettre de mots dans la réponse de SearchLiaison, mais il semble qu’ils laissent entendre que faire une seule chose qui est un indicateur possible d’inutilité n’est pas suffisant pour qualifier la page Web d’inutile lorsqu’il n’y a aucun autre signal négatif.

Voici ce que SearchLiaison a dit :

« Si vous changez simplement la date parce que vous pensez que « cela fera penser à Google que c’est nouveau », vous vous alignez probablement sur d’autres comportements qui correspondent globalement aux signaux que nous utilisons pour identifier l’utilité du contenu.

C’est bien que SearchLiaison ait clarifié ce point car je trouvais aussi que le passage me paraissait trop large et pouvait conduire à des faux positifs (quand un site innocent est classé comme spam).