La dernière recherche of the record de Google a partagé une multitude d'informations sur le fonctionnement réel de la recherche Google. John Mueller et Lizzi Sassman de Google se sont entretenus avec Elizabeth Tucker, directrice de la gestion des produits chez Google, qui a partagé ses idées sur les nombreux systèmes qui fonctionnent ensemble pour classer les pages Web, y compris une mention d'un système d'actualité.
Google et l'actualité
Le mot « actualité » signifie à quel point quelque chose est pertinent dans le moment présent. Mais lorsqu'il est utilisé dans la recherche, le mot « actualité » consiste à faire correspondre le sujet d'une requête de recherche avec le contenu d'une page Web. Les modèles d'apprentissage automatique jouent un rôle important en aidant Google à comprendre ce que veulent dire les utilisateurs.
Un exemple mentionné par Elizabeth Tucker est BERT (Bidirectionnel Encoder Representations from Transformers), un modèle de langage qui aide Google à comprendre un mot dans le contexte des mots qui le précèdent et qui le suivent (c'est plus, c'est une explication miniature).
Elizabeth explique l’importance de faire correspondre un contenu pertinent sur le plan thématique à une requête de recherche dans le contexte de la satisfaction de l’utilisateur.
Lizzi Sassman, de Google, a posé des questions sur la satisfaction des utilisateurs et Tucker a mentionné qu'il existe de nombreuses dimensions de recherche, avec de nombreux systèmes, en utilisant comme exemple l'importance du concept de pertinence thématique.
Lizzi a demandé (à environ 4 minutes et 20 secondes) :
« En ce qui concerne la satisfaction que vous avez mentionnée, existe-t-il des moyens plus précis que nous envisageons ? Qu’est-ce que cela signifie d’être satisfait lorsque l’on sort d’une recherche ?
Elizabeth répondit :
« Absolument, Lizzi. Dans le cadre de la qualité de la recherche, nous réfléchissons à de nombreuses dimensions importantes de la recherche. Nous avons tellement de systèmes. Nous souhaitons évidemment afficher du contenu pertinent par rapport à votre recherche. Au début de la recherche Google, cela représentait parfois un défi.
Nos systèmes se sont beaucoup améliorés, mais il arrive encore que nous ayons du mal à effectuer certaines recherches, notamment celles qui sont vraiment difficiles. Les gens effectuent leurs recherches de multiples façons : en tapant des mots-clés, en parlant à Google et en utilisant le langage courant. J'ai vu des recherches incroyables. « Dis donc Google, qui est cette personne qui, il y a des années, a fait telle chose, et je ne me souviens plus du nom de cette chose ? » Vous savez, ces longues requêtes qui sont très vagues. Et c'est incroyable que nous ayons maintenant des systèmes qui peuvent même répondre à certaines d'entre elles.
Emporter:
Un point important à retenir de cet échange est qu'il existe de nombreux systèmes qui fonctionnent ensemble, l'actualité n'étant que l'un d'entre eux. De nombreux membres de la communauté du marketing de recherche ont tendance à se concentrer sur l'importance d'un seul élément, comme l'autorité ou l'utilité, mais en réalité, la recherche comporte de nombreuses « dimensions » et il est contreproductif de réduire les facteurs qui entrent en jeu dans la recherche à un, deux ou trois concepts.
Les biais dans la recherche
John Mueller de Google a demandé à Elizabeth ce qu'il en était des biais dans la recherche et si Google y réfléchissait. Elle a répondu qu'il existe de nombreux types de biais que Google surveille et essaie de détecter. Tucker explique les différents types de résultats de recherche qui peuvent être pertinents sur le plan thématique (tels que les résultats persistants et les résultats récents) et explique ensuite comment Google s'efforce d'obtenir un équilibre correct.
John a demandé (à 05:24 minutes) :
« Lorsque vous examinez les données, je suppose que des biais apparaissent. Est-ce un sujet auquel nous réfléchissons également ? »
Elisabeth répondit :
« Absolument. Il y a toutes sortes de biais qui nous inquiètent lorsque vous recherchez des informations. Montrons-nous de manière disproportionnée certains types de sites, montrons-nous plus d'encyclopédies et de résultats permanents ou montrons-nous plus de résultats récents avec des informations à jour, montrons-nous les résultats de grands sites institutionnels, montrons-nous les résultats de petits blogs, montrons-nous les résultats de plateformes de médias sociaux sur lesquelles nous avons des voix de tous les jours ?
Nous voulons nous assurer que nous disposons d'un mélange approprié qui nous permette de faire ressortir le meilleur du Web sous n'importe quelle forme ou taille, avec des objectifs modestes.
Systèmes d'actualité de base (et bien d'autres)
Elizabeth a ensuite réitéré qu'elle travaillait avec de nombreux types de systèmes de recherche. C'est quelque chose à garder à l'esprit car la communauté de recherche ne connaît que quelques systèmes alors qu'en fait il existe de très nombreux systèmes.
Cela signifie qu'il est important de ne pas se concentrer sur un, deux ou trois systèmes seulement lorsque l'on essaie de déboguer un problème de classement, mais plutôt de garder l'esprit ouvert sur le fait qu'il peut s'agir de tout autre chose, pas seulement de l'utilité, de l'EEAT ou d'autres raisons.
John Mueller a demandé si la recherche Google réagissait en rétrogradant un site lorsque les utilisateurs se plaignent de certains résultats de recherche.
Elle parle de plusieurs choses, notamment du fait que la plupart des systèmes sur lesquels elle travaille n'ont rien à voir avec la rétrogradation de sites. Je tiens à souligner qu'elle mentionne qu'elle travaille avec de nombreux systèmes et de nombreux signaux (pas seulement la poignée de signaux sur lesquels la communauté du marketing de recherche a tendance à se concentrer).
L'un de ces systèmes qu'elle mentionne est celui des systèmes d'actualité de base. Qu'est-ce que cela signifie? Elle explique qu'il s'agit de faire correspondre le sujet de la requête de recherche. Elle parle de « systèmes d'actualité de base », donc cela signifie probablement plusieurs systèmes et algorithmes.
John a demandé (à 11:20 minutes) :
« Lorsque les gens s’expriment haut et fort, la première étape consiste-t-elle à procéder à une sorte de rétrogradation en disant : « Eh bien, c’était clairement un mauvais site que nous avons montré, nous devrions donc en montrer moins » ? Ou comment équilibrer le côté positif des choses que nous devrions peut-être montrer davantage et le contenu que nous devrions montrer moins ? »
Elizabeth répondit :
« Oui, c'est une excellente question. Je travaille sur de nombreux systèmes différents. C'est une partie amusante de mon travail dans le domaine de la qualité de la recherche. Nous avons de nombreux signaux, de nombreux systèmes, qui doivent tous fonctionner ensemble pour produire une excellente page de résultats de recherche.
Certains systèmes sont par nature démotivants, et le spam en est un bon exemple. Si nous avons un problème avec, par exemple, des sites de téléchargement malveillants, nous voudrions probablement le résoudre en essayant de découvrir quels sites se comportent mal et en essayant de nous assurer que les utilisateurs ne tombent pas sur ces sites.
La plupart des systèmes avec lesquels je travaille tentent en réalité de trouver le bien. Un exemple : j'ai travaillé avec certains de nos principaux systèmes de topicité, c'est-à-dire des systèmes qui tentent de correspondre au sujet de la requête.
Ce n’est pas si difficile si vous avez une requête par mot clé, mais la langue est globalement difficile. Nous avons réalisé de merveilleuses avancées dans la compréhension du langage naturel ces dernières années grâce au ML.
modèles, et nous voulons donc exploiter une grande partie de cette technologie pour vraiment nous assurer que nous comprenons les recherches des gens afin que nous puissions trouver le contenu qui correspond à cela. C'est un problème étonnamment difficile.Et l’une des choses intéressantes que nous avons découvertes en travaillant sur ce que nous pourrions appeler l’actualité, un mot un peu ringard, c’est que plus nous sommes capables de le faire, plus les recherches que les gens feront seront intéressantes et difficiles.
Comment Google se concentre sur les sujets de recherche
Elizabeth revient sur la discussion de l'actualité, en la désignant cette fois comme « l'espace d'actualité » et des efforts déployés par Google pour y parvenir. D'une manière particulièrement importante, elle souligne à quel point Google était autrefois très concentré sur les mots-clés, avec l'implication claire qu'ils ne s'y concentrent plus autant, expliquant l'importance de l'actualité.
Elle en parle à 13 min 16 s :
« Google était donc très axé sur les mots clés. Si vous associez simplement quelques mots avec des prépositions, nous risquons de nous tromper. Les prépositions sont très difficiles ou l'étaient autrefois pour nos systèmes. Je veux dire, en y repensant, c'est risible, non ?
Mais autrefois, les gens tapaient un, deux, trois mots-clés. Quand j'ai commencé à travailler chez Google, si une recherche comportait plus de quatre mots, nous la considérions comme longue. Aujourd'hui, je vois régulièrement des recherches longues qui peuvent comporter 10 à 20 mots, voire plus. Lorsque nous effectuons ces recherches plus longues, il devient difficile de comprendre quels mots sont importants.
Par exemple, c'était il y a des années et des années, peut-être il y a près de dix ans, mais nous étions confrontés à des recherches qui étaient des questions. Un exemple classique est « quelle est la taille de Barack Obama ? Parce que nous voulions des pages qui fourniraient la réponse, et ne correspondraient pas seulement aux mots quelle est la taille, n'est-ce pas ?
En fait, lorsque nos extraits vedettes ont été créés, ils ont été motivés par ce genre de problème. Comment pouvons-nous faire correspondre la réponse, et pas seulement les mots clés aux mots de la question ? Au fil des ans, nous avons beaucoup travaillé dans ce que nous pourrions appeler l'espace de l'actualité. C'est un espace dans lequel nous continuons à travailler encore aujourd'hui.
L'importance des sujets et de l'actualité
Il y a beaucoup à comprendre dans la réponse de Tucker, notamment qu'il peut être utile, lorsque l'on réfléchit aux algorithmes de classement de recherche de Google, de prendre également en compte les principaux systèmes de thématiques qui aident Google à comprendre les sujets des requêtes de recherche et à les faire correspondre au contenu des pages Web, car cela souligne l'importance de penser en termes de sujets au lieu de se concentrer sur le classement des mots clés.
Une erreur courante que je constate chez les personnes qui ont du mal à se classer est qu'elles se concentrent fortement sur les mots-clés. J'encourage depuis de nombreuses années une approche alternative qui souligne l'importance de penser en termes de sujets. C'est une façon multidimensionnelle de penser au référencement. L'optimisation pour les mots-clés est unidimensionnelle. L'optimisation pour un sujet est multidimensionnelle et s'aligne sur la façon dont Google Search classe les pages Web dans la mesure où la thématique est une partie importante du classement.
Écoutez le podcast Search Off The Record à partir de la minute 4:20 environ, puis avancez rapidement jusqu'à la minute 11:20 :