38 % des pages Web de 2013 ont disparu

Une nouvelle étude du Pew Research Center révèle le caractère éphémère de l'information en ligne : 38 % des pages Web de 2013 ne sont plus accessibles une décennie plus tard.

L'analyse, menée en octobre, a examiné les liens rompus sur les sites Web gouvernementaux et d'information ainsi que dans la section « Références » des pages Wikipédia.

Les résultats révèlent que :

  • 23% de pages Web d'actualités et 21% des pages Web du gouvernement contiennent au moins un lien brisé
  • Les pages Web des gouvernements locaux, en particulier celles appartenant aux gouvernements municipaux, sont particulièrement sujettes aux liens rompus.
  • 54% des pages Wikipédia ont au moins un lien dans leur section « Références » pointant vers une page inexistante

Les médias sociaux ne sont pas à l’abri de la disparition de contenu

Pour étudier l’impact du déclin numérique sur les réseaux sociaux, Pew Research a collecté un échantillon en temps réel de tweets sur X et les a surveillés pendant trois mois.

L’étude a révélé que « près d’un tweet sur cinq n’est plus visible publiquement sur le site quelques mois seulement après sa publication ».

Dans 60% Dans ces cas, le compte de publication d'origine a été rendu privé, suspendu ou supprimé.

Dans le reste 40%le titulaire du compte a supprimé le tweet, mais le compte existait toujours.

Certains types de tweets sont plus susceptibles de disparaître que d’autres, avec plus de 40% des tweets rédigés en turc ou en arabe ne sont plus visibles dans les trois mois suivant leur publication.

De plus, les tweets provenant de comptes avec des paramètres de profil par défaut sont particulièrement susceptibles de disparaître de la vue du public.

Définir des liens et des pages Web « inaccessibles »

Pour les besoins de ce rapport, le Pew Research Center s'est concentré sur les pages qui n'existent plus lors de la définition de l'inaccessibilité.

D'autres définitions, telles que la modification du contenu ou les problèmes d'accessibilité pour les utilisateurs malvoyants, dépassaient le cadre de la recherche.

L'étude a utilisé une approche conservatrice, comptant les pages comme inaccessibles si elles renvoyaient l'un des neuf codes d'erreur, indiquant que la page et/ou son serveur hôte n'existent plus ou sont devenus non fonctionnels.

Pourquoi SEJ s'en soucie

Le déclin numérique soulève d’importantes questions sur la préservation et l’accessibilité du contenu en ligne pour les générations futures.

L'étude du Pew Research Center met en lumière l'ampleur de ce problème dans divers espaces en ligne, depuis les sites Web gouvernementaux et d'information jusqu'aux plateformes de médias sociaux.

Le taux élevé de pourriture des liens et de pages Web qui disparaissent a des implications pour quiconque s’appuie sur Internet comme source d’information fiable.

Cela pose des problèmes pour citer des sources en ligne, car le contenu original pourrait ne plus être accessible à l'avenir.

Ce que cela signifie pour les professionnels du référencement

Cette étude souligne la nécessité d'auditer et de mettre à jour régulièrement les anciens contenus, ainsi que de surveiller systématiquement les liens rompus et de les résoudre rapidement.

Les professionnels du référencement devraient également prendre en compte l’impact de la dégradation numérique sur les profils de backlinks.

Lorsque les liens externes vers un site Web deviennent inaccessibles, cela peut affecter l’équité et l’autorité des liens du site aux yeux des moteurs de recherche.

La surveillance et la diversification des sources de backlinks peuvent aider à atténuer le risque de perte de liens précieux à cause du déclin numérique.

Enfin, les résultats de l'étude sur le contenu des médias sociaux prouvent que les efforts de référencement devraient se concentrer sur le retour des utilisateurs vers des canaux plus stables et détenus comme les sites Web et les listes de diffusion.