Quelqu’un sur Reddit a posé une question sur la modification du code d’un site Web en dix langues à l’échelle du site. John Mueller de Google a donné des conseils généraux sur les pièges des changements à l’échelle du site et a parlé de complexité (impliquant la valeur de la simplicité).
La question était liée au hreflang mais la réponse de Mueller, parce qu’elle était de nature générale, avait une valeur plus large pour le référencement.
Voici la question qui a été posée :
« Je travaille sur un site Web qui contient 10 langues et 20 codes culturels. Disons que blog-abc a été publié dans toutes les langues. Les balises hreflang dans toutes les langues pointent vers la version blog-abc basée sur la langue. Pour en, cela peut être en/blog-abc
Ils ont mis à jour celui en anglais et l’URL a été mise à jour vers blog-def. La balise hreflang sur la page du blog anglais pour en sera mise à jour en en/blog-def. Celui-ci ne sera cependant pas mis à jour dynamiquement dans le code source des autres langages. Ils pointeront toujours vers en/blog-abc. Pour mettre à jour les balises hreflang dans d’autres langues, nous devrons également les republier.
Étant donné que nous essayons de rendre les pages aussi statiques que possible, il se peut que la mise à jour dynamique des balises hreflang ne soit pas une option. Les options dont nous disposons sont soit de mettre à jour les balises hreflang périodiquement (disons une fois par mois), soit de déplacer les balises hreflang vers le plan du site.
Si vous pensez qu’il existe une autre option, cela sera également utile.
Les modifications à l’échelle du site prennent beaucoup de temps à être traitées
J’ai récemment lu quelque chose d’intéressant dans un document de recherche qui m’a rappelé ce que John Mueller avait dit sur le temps nécessaire à Google pour comprendre que les pages mises à jour sont liées au reste d’Internet.
Le document de recherche mentionnait comment les pages Web mises à jour nécessitaient de recalculer les significations sémantiques des pages Web (les intégrations), puis de procéder de la même manière pour le reste des documents.
Voici ce que dit en passant le document de recherche (PDF) sur l’ajout de nouvelles pages à un index de recherche :
« Considérez le scénario réaliste dans lequel de nouveaux documents sont continuellement ajoutés au corpus indexé. La mise à jour de l’index dans les méthodes basées sur un double encodeur nécessite le calcul des intégrations pour les nouveaux documents, suivi de la réindexation de toutes les intégrations de documents.
En revanche, la construction d’index à l’aide d’un DSI implique la formation d’un modèle Transformer. Par conséquent, le modèle doit être recyclé à partir de zéro à chaque fois que le corpus sous-jacent est mis à jour, ce qui entraîne des coûts de calcul prohibitifs par rapport aux doubles encodeurs.
Je mentionne ce passage car en 2021, John Mueller a déclaré que cela pouvait prendre des mois à Google pour évaluer la qualité et la pertinence d’un site et a mentionné comment Google essaie de comprendre comment un site Web s’intègre dans le reste du Web.
Voici ce qu’il a dit en 2021 :
« Je pense que c’est beaucoup plus délicat lorsqu’il s’agit de questions de qualité en général, car évaluer la qualité globale et la pertinence d’un site Web n’est pas très facile.
Il nous faut beaucoup de temps pour comprendre comment un site Web s’intègre par rapport au reste d’Internet.
Et c’est quelque chose qui peut facilement prendre, je ne sais pas, quelques mois, six mois, parfois même plus de six mois, pour que nous reconnaissions des changements significatifs dans la qualité globale du site.
Parce que nous veillons essentiellement à savoir comment ce site Web s’intègre dans le contexte du Web dans son ensemble et cela prend beaucoup de temps.
C’est donc quelque chose pour lequel je dirais que, par rapport aux problèmes techniques, il faut beaucoup plus de temps pour actualiser les choses à cet égard.
Cette partie concernant l’évaluation de la manière dont un site Web s’intègre dans le contexte du Web global est une déclaration curieuse et inhabituelle.
Ce qu’il a dit sur l’intégration dans le contexte du Web dans son ensemble ressemblait étonnamment à ce que le document de recherche disait sur la façon dont l’index de recherche « nécessite le calcul des intégrations pour les nouveaux documents, suivi de la réindexation de toutes les intégrations de documents.»
Voici la réponse de John Mueller dans Reddit concernant le problème lié à la mise à jour de nombreuses URL :
« En général, le traitement de la modification des URL sur un site plus grand prendra du temps (c’est pourquoi j’aime recommander des URL stables… quelqu’un a dit un jour que les URL sympas ne changent pas ; je ne pense pas qu’il s’agisse du référencement, mais aussi pour référencement). Je ne pense pas qu’aucune de ces approches ne changerait cela de manière significative.
Que veut dire Mueller lorsqu’il dit que les grands changements prennent du temps à être mis en œuvre ? Cela pourrait être similaire à ce qu’il a dit en 2021 à propos d’une nouvelle évaluation du site pour sa qualité et sa pertinence. Cette partie relative à la pertinence pourrait également être similaire à ce que dit le document de recherche à propos des intégrations informatiques », qui concernent la création de représentations vectorielles des mots sur une page Web dans le cadre de la compréhension de la signification sémantique.
Voir également: Recherche de vecteurs : optimisation pour l’esprit humain grâce à l’apprentissage automatique
La complexité a des coûts à long terme
John Mueller a poursuivi sa réponse :
« Une question plus méta pourrait être de savoir si vous voyez suffisamment de résultats de cette configuration quelque peu complexe pour mériter de passer du temps à la maintenir ainsi, si vous pouvez abandonner la configuration hreflang, ou si vous pouvez même supprimer les versions nationales et simplifier même plus.
La complexité n’ajoute pas toujours de la valeur et entraîne un coût à long terme.
Créer des sites avec autant de simplicité que possible est quelque chose que je fais depuis plus de vingt ans. Mueller a raison. Cela rend les mises à jour et les refontes beaucoup plus faciles.