Les sites de spam IA battent la mise à jour anti-spam de Google de mars 2024

Alors que les sites Web honnêtes ont connu les hauts et les bas de la mise à jour de Google de mars 2024, les référenceurs et les blogueurs de recettes ont remarqué que les sites de spam IA se hissaient en tête des résultats de recherche. Hier, un exemple s’est classé pour plus de 217 000 requêtes, dont 14,9 000 se classent dans le top 10 – et ce nombre a augmenté un jour plus tard. C’est ce qui se passe et comment les spammeurs continuent de battre Google.

Augmentation en mars 2024

Le site classé est un sous-domaine. Le domaine principal existe depuis l’été 2020. Le sous-domaine spammé a été repéré pour la première fois par Internet Archive le 30 novembre 2022, soit par coïncidence la date de lancement de ChatGPT. Le sous-domaine était à moitié terminé et essentiellement inactif jusqu’en mars 2024, date à laquelle il s’est rapidement développé et a immédiatement commencé à être classé pour des milliers de requêtes de recherche.

Mercredi 20 mars, le site classait 14,9 000 requêtes de recherche dans le top 10. Jeudi 21 mars, le site comptait 15,6 000 requêtes dans le top 10. Même si Google vient de terminer sa mise à jour anti-spam, ce site particulier (et d’autres similaires) continue de se classer. pour des milliers de requêtes de recherche et Google semble impuissant à les arrêter.

Un écrivain culinaire réagit au spam de l’IA

Un écrivain culinaire et auteur de livres de cuisine, Robin Donovan (Instagram), a attiré mon attention sur le site d’IA, me disant que d’autres membres d’un groupe Facebook privé étaient furieux face aux sites d’IA qui affluaient pour les requêtes de recherche de recettes.

Il est très évident que le contenu est généré par l’IA, même les images accompagnant les articles sont 100 % IA. Il est donc particulièrement blessant pour ceux qui ont de l’expérience, de l’expertise et de l’autorité de voir le contenu de l’IA les surpasser.

Robin était naturellement bouleversé :

« Comment diable est-ce le meilleur contenu ? Et pendant ce temps, les blogueurs qui sont des chefs professionnels, des développeurs de recettes, des auteurs de livres de cuisine et d’autres personnes possédant des décennies de formation et d’expérience voient leurs sites être décimés par ces mises à jour. Des sites qu’ils ont passé des années à créer avec des articles bien documentés et bien écrits (écrits par des humains !), des recettes qui ont été développées par des professionnels et soigneusement testées, des photographies qu’ils ont passé des heures à préparer et à prendre.

Ils ont fait tout ce que Google leur a dit de faire pendant des années : rédiger votre propre contenu, prendre vos propres photos, développer des recettes uniques et de haute qualité, être un expert dans votre domaine et avoir des informations d’identification pour le montrer, ne le faites pas. N’essayez pas de jouer avec le système, soyez authentique, créez du contenu UTILE. Pour quoi? »

Détails sur les sites de spam

1. Hébergé sur Squarespace

Le site de spam se trouve sur un sous-domaine et le sous-domaine ainsi que le site principal sont hébergés sur Squarespace. Pourquoi Squarespace ? Juste une supposition, mais peut-être que cette infrastructure a généralement tendance à paraître légitime à Google (ou qu’elle pourrait ne pas jouer un rôle).

2. Toutes les images sont colorées et simples

Toutes les images sont générées par l’IA, créées dans un style plat et coloré similaire à ce que l’on pourrait voir dans une infographie, indiquant qu’une invite basée sur un modèle a été utilisée pour créer les milliers d’images accompagnant les articles.

Les images sont un élément important des articles. Chaque article contient environ sept images liées au sujet général de l’article. Chaque article contient un arc-en-ciel de couleurs. Je ne sais pas si les images sont intentionnellement lumineuses et colorées, mais l’utilisation de couleurs vives est un bon choix stratégique pour les images car elles apparaissent dans les SERP, Google Discover et Google SGE.

J’ai téléchargé l’une des images sur ChatGPT et lui ai demandé de générer une invite basée sur l’image pour en créer une nouvelle dans le même style.

Voici un exemple d’image générée par l’IA dans le même style que les sites de spam d’IA :

Exemple d’image générée par l’IA utilisée par un site de spam

3. Tous les articles suivent un modèle rigide

Les articles suivent une structure structurée, qui varie en fonction du type d’article. Les sujets des articles vont des comparaisons, aux voyages à destination locale, au style de vie, aux recettes, aux bienfaits pour la santé de certains aliments, etc.

Les articles liés à la santé suivent cette structure de modèle :

un. Introduction
Présente le sujet conceptuel discuté et sa pertinence par rapport à un sujet spécifique lié à la santé. Le thème conceptuel peut être un aliment particulier, un type de régime, etc.

b. Avantages pour la santé
Après l’introduction, chacun discute des bienfaits pour la santé associés au sujet conceptuel.

c. Fondamentaux
Cette section aborde les bases du sujet de santé sur lequel nous nous concentrons (santé bucco-dentaire, diabète…), l’importance de la nutrition et les problèmes ou maladies courants associés au sujet de santé.

d. Conseils nutritionnels et nutriments clés

e. Choix alimentaires et impact sur la santé

F. Astuces et conseils de style de vie

g. Un résumé des avantages

4. Invite sous-jacente aux articles générés par l’IA

J’étais curieux de savoir à quoi ressemblerait une invite qui génère ce contenu, j’ai donc demandé à ChatGPT d’en créer une.

Il s’agit d’une invite généralisée qui aurait pu être utilisée pour créer les articles sur la santé et l’alimentation :

« Écrivez un article explorant le lien entre [concept of dietary choice] et [specific health focus]en suivant le modèle ci-dessous :

un. Introduction: Commencez par introduire le concept de [concept of dietary choice]sa définition et pourquoi il est pertinent pour [specific health focus].
Discutez de sa popularité croissante et de la manière dont elle s’aligne sur les tendances contemporaines en matière de santé et de style de vie.

b. Avantages pour la santé :

Élaborer sur les bienfaits généraux pour la santé associés à [concept of dietary choice]en se concentrant sur son potentiel à améliorer [specific health focus].

c. Fondamentaux de [Health Topic]:

Fournir un contexte sur le [specific health focus]y compris l’anatomie essentielle, l’importance de la nutrition et les conditions prévalentes affectant cet aspect de la santé.

d. Nutriments clés et leur impact :

Détaillez les nutriments essentiels qui jouent un rôle important dans [specific health focus], y compris leurs sources et les bienfaits qu’ils offrent pour la santé. Soulignez l’importance de certaines vitamines, minéraux et autres composés.

e. Influence des choix alimentaires :

Analyser comment des choix alimentaires spécifiques sont influencés par [concept of dietary choice] peut avoir un impact [specific health focus], positivement ou négativement. Recommander des aliments bénéfiques et déconseiller certains types qui peuvent nuire [specific health focus].

F. Conseils pratiques pour l’alimentation et le mode de vie :

Proposer des suggestions pratiques pour intégrer des aliments bénéfiques dans son alimentation et apporter des ajustements à son mode de vie pour soutenir [specific health focus]. Cela peut inclure des conseils sur la préparation des repas, le contrôle des portions et l’équilibrage des différents types d’aliments.

g. Une invite à utiliser pour générer une conclusion :

Concluez l’article en résumant comment adopter [concept of dietary choice] peut contribuer à améliorer [specific health focus].
Insistez sur l’équilibre et la variété des nutriments apportés par cette approche ainsi que sur ses avantages potentiels au-delà [specific health focus]. Assurez-vous que l’article fournit un aperçu complet, à la fois informatif et engageant, destiné aux lecteurs intéressés à comprendre la relation entre [concept of dietary choice] et [specific health focus].»

5. Contenu testé par les outils AI Checker

Ce qui est étrange à propos de ces articles, c’est que chaque article que j’ai testé avec GPTZero AI Content Detector a obtenu un score de 100 % comme généré par l’IA. Le vérificateur de contenu Originality.AI a offert des scores similaires.

Capture d’écran du score GPTZero

Les sites de spam IA battent la mise à jour anti-spam de Google de mars 2024

Capture d’écran du score Originality.AI

Les sites de spam IA battent la mise à jour anti-spam de Google de mars 2024

Les modèles Squarespace sont professionnels et les articles eux-mêmes sont dans un style sec et informatif mais manquent de signes d’auteur humain tels que des expressions de perspicacité ou d’expérience et une absence totale de expressions familières. Chaque article testé a échoué aux tests de détection de l’IA.

6. Comment les sites de spam IA se classent-ils ?

Mon hypothèse est que la raison pour laquelle ces sites de spam sont classés est qu’ils profitent d’une faille dans les algorithmes de Google qui permet au nouveau contenu de recevoir un premier coup de pouce, ce que John Mueller de Google a décrit comme étant un test de Google sur le site Web ou sur les pages Web. Cela arrive tout le temps et excite les gens lorsqu’ils publient un nouveau site et le voient se classer presque immédiatement.

Ce qui se passe avec ce site Web généré par l’IA, c’est qu’il publie chaque jour d’énormes quantités de pages Web et que ces pages sont placées en haut des pages de résultats des moteurs de recherche (SERP) pendant les premières 24 à 48 heures. Ils commencent ensuite à descendre dans le top dix et finalement dans les deuxièmes pages des SERP. Mais à ce moment-là, de nouvelles pages commencent chaque jour ce voyage depuis le coup de pouce initial. Il s’agit d’une stratégie classique de la vieille école connue sous le nom de churn and burn.

John Mueller a déjà expliqué pourquoi Google classe les nouveaux sites Web en tête des résultats de recherche.

Il expliqua:

« En particulier, avec des sites Web entièrement nouveaux, l’une des difficultés que nous rencontrons est que nous n’avons peut-être pas beaucoup de signaux pour ces sites Web, nous devons donc faire des estimations.

Et selon la façon dont nous faisons nos estimations, cela peut parfois signifier qu’au début nous montrons ce site Web un peu plus visiblement que ce que les signaux nous disent à la fin.

…Mais cela peut aller dans les deux sens. Cela peut aller dans le sens où cela vous est montré très visiblement au début.

Et il se peut aussi que vous soyez moins visible au début et que nous comprenons votre site Web et comment il s’intègre au reste du Web, nous pouvons en quelque sorte ajuster cela.

…Parfois, ce sont aussi de nouveaux sites Web qui apparaissent que nous essayons d’exploiter très rapidement.

7. Le spam AI est un problème de longue date avec Google

Google a depuis longtemps un problème avec les sites générés par l’IA qui dominent certains résultats de recherche et ce n’est pas la première fois que Google est submergé de spam, en particulier pour des expressions relativement longues. Ce site de spam n’est pas seul et n’est pas une exception. Il en existe bien d’autres qui suivent les mêmes méthodes de classement.

Ce qui rend cet exemple remarquable, c’est qu’il a été mis en ligne au même moment où Google a lancé une mise à jour anti-spam et qu’il a continué à se classer en tête des SERP pour des centaines de milliers de requêtes de recherche (avec 15,6 000 requêtes actuellement dans le top 10).

Le site de spam AI est maintenant apparu de l’autre côté de la mise à jour du spam et fait un pied de nez à Google. C’est une expérience humiliante et démoralisante pour les milliers de blogueurs honnêtes et expérimentés qui sont devancés par un contenu manquant de crédibilité, d’expérience et d’autorité – ces articles ne mentionnent même pas les auteurs.