Tirez parti de BigQuery pour une analyse avancée des liens internes

Conditions préalables

Tout d'abord, vous aurez besoin d'un CSV contenant tous vos liens internes.

À tout le moins, votre fichier doit avoir une colonne pour la source (origine du lien interne) et une colonne pour la destination (où mène le lien). Cependant, si possible, incluez des colonnes supplémentaires pour l'ancre, le code d'état et le type de lien (tel que l'image, le texte et le hreflang) pour enrichir votre analyse.

Par exemple, j'ai utilisé les données du site Web de mon agence. Bien qu'il s'agisse d'un petit site avec 1 678 pages (y compris les redirections et les pages erronées), il contient 338 656 liens en tenant compte du CSS, du JavaScript, des plans de site, etc. Bien que gérable dans une feuille Excel brute, l’application de formules et de filtres personnalisés peut s’avérer difficile.

Ci-dessous mes colonnes CSV :

  • Type : identifie si le lien provient d'un plan du site, d'un hreflang, d'un lien hypertexte canonique, simple, d'une image, d'un CSS, etc.

  • Source : La page où se trouve le lien.

  • Destination : pointe vers la page cible.

  • Texte alternatif : si le lien est une image, cette colonne contient le texte de son attribut alt.

  • Ancre : Le code d'état HTTP de la destination.

  • Statut : Le statut de la destination (par exemple, canonique, non indexable).

  • Suivre : utile pour déterminer si le lien a un impact sur le référencement.

  • Position du lien : indique si le lien se trouve dans la navigation, l'en-tête, le contenu ou ailleurs. Assurez-vous que les paramètres de l’outil sont précis.

  • Origine du lien : Spécifie si le lien est uniquement présent dans l'exécution HTML ou dans l'exécution HTML post-JavaScript rendue. Ceci est utile pour dépanner les sites Web riches en JavaScript.

Une fois le fichier prêt et un compte Google Cloud configuré, quelle est la prochaine étape ?

Il existe deux options :

1. Si votre fichier fait moins de 100 Mo, téléchargez-le directement via l'interface BigQuery

2. Pour les fichiers plus volumineux, utilisez Cloud Storage.

Bien que le processus soit similaire à la première option, j'explorerai la deuxième option (car mon fichier dépasse 100 Mo).

Créez un bucket et chargez le CSV

1. Retournez au Cloud Hub et cliquez sur « Cloud Storage » en bas à gauche.