Comment analyser les URL et les pages indexées avec SISTRIX

La Toolbox SISTRIX vous permet d’analyser une URL exactement comme vous le feriez avec un domaine, afin de connaître sa visibilité et son classement sur Google, tant sur mobile que sur desktop. Cette fonctionnalité se révèle très utile pour découvrir les pages qui se classent particulièrement bien sur le moteur de recherche, ou pour vérifier la performance en ligne d’URLs spécifiques après une migration de site Web. Dans ce tutoriel, nous vous montrerons comment utiliser la Toolbox pour évaluer le nombre de pages indexées de votre domaine, une démarche fondamentale pour savoir si Google a des problèmes concernant l’indexation du domaine.

Où puis-je trouver des informations sur les URL de mon site Web dans l’outil ?


Une grande majorité des tableaux de mots-clés de la Toolbox SISTRIX indiquent également les URLs classées pour ces mots-clés.

Si vous souhaitez obtenir un aperçu détaillé de toutes les URLs classées de votre site Web (tant sur mobile que desktop), la section « URL » est le meilleur endroit où chercher.

Pour y accéder, il vous suffit de taper le domaine que vous souhaitez évaluer dans la barre de recherche de la Toolbox 1 et de cliquer sur la rubrique « URL » dans la colonne de navigation de gauche 2.

Notez que les données contenues dans cette section proviennent de la database complète de la Toolbox SISTRIX, vous permettant de travailler avec l’ensemble de données le plus complet possible.

Aperçu des fonctions disponibles

La section « URL » de la Toolbox met à votre disposition de nombreuses options pour trouver et évaluer les données aussi rapidement et efficacement que possible.

Avant de commencer votre évaluation, regardons de plus près les options en haut à droite de la page, qui nous permettent de visualiser les données relatives à l’URL selon :

  • La date : par défaut, la Toolbox affiche les données de la semaine en cours. Cliquez sur ce bouton pour sélectionner une date dans le passé.
  • Les options : sélectionnez différentes options pour le tableau (plus d’informations ci-dessous).
  • Export : exportez le tableau sous forme de fichier CSV. Pour ce faire, vous devrez utiliser des crédits.
  • Shortlink : partagez le tableau sur les médias sociaux.

En cliquant sur les options du menu déroulant, vous pourrez modifier certains paramètres du tableau des URLs ou personnaliser certains filtres :

  • Sélectionner colonnes : vous pouvez modifier les colonnes apparaissant dans le tableau, en choisissant uniquement celles qui vous intéressent. La Toolbox enregistrera vos préférences ainsi que votre choix par défaut.
  • Filtrer : vous pouvez conserver votre propre combinaison de filtres pour vous en resservir lors de prochaines recherches, ce qui vous fera gagner du temps. Vous pouvez aussi sélectionner une des combinaisons de filtres que vous avez enregistrées ou la supprimer.
  • Source des données : choisissez entre données mobile et desktop ainsi que les pages indexées.

Lorsque vous cliquez sur la flèche vers le bas à côté de la bascule mobile / desktop, vous accédez aux pages indexées.

Là, vous pourrez voir le nombre de pages indexées par Google pour le domaine en question. Nous reviendrons sur cette section plus loin dans cet article.

N’oubliez pas que vous pouvez ajouter tous les éléments contenus dans cette section dans un tableau de bord ou un rapport. N’hésitez pas à lire les articles suivants pour plus d’informations sur ces deux fonctionnalités :

·  Comment créer et paramétrer des rapports dans la Toolbox SISTRIX

·  Comment utiliser les tableaux de bord Sistrix pour le suivi SEO et des flux de travail

Informations générales sur les données d’URL

Juste en dessous de l’en-tête, vous verrez quatre encadrés contenant des informations générales sur les URLs du domaine.

urlsmobile_domain_leboncoin.fr

Le premier encadré vous indique le nombre d’URL de ce domaine qui se classent dans le Top-100 de Google pour au moins un mot-clé. La flèche indique la variation en % par rapport à la semaine précédente.

Un changement soudain de valeur pourrait être le signe d’un éventuel problème d’indexation du site Web.

Quantité de mots-clés classés par URL

Le deuxième encadré vous indique la quantité moyenne de mots-clés dans le Top-10 et le Top-100 pour lesquels les différentes URLs sont classées, vous offrant ainsi un aperçu simple et rapide. Un domaine ayant de bonnes performances devrait avoir au moins 20 % de ses URLs classées sur la première page de résultats.

Proportion d’URL utilisant un HTTPS

Ces données vous permettent de découvrir combien d’URLs classées utilisent un protocole HTTPS (SSL) et combien n’utilisent qu’un protocole HTTP. N’oubliez pas : les pages qui n’utilisent toujours pas de protocole de cryptage sont marquées par Google comme « non sécurisées », amenant rapidement l’utilisateur à partir à la recherche d’un concurrent. De plus, le HTTPS peut donner un petit coup de boost au classement du domaine.

Enfin, cet encadré vous indique la longueur moyenne, la profondeur architecturale (répertoires) et le nombre de paramètres ajoutés pour toutes les URLs classées.

Filtres

Les filtres vous permettent d’affiner votre liste d’URLs et de découvrir des fonctionnalités susceptibles d’être optimisées.

Certains filtres sont immédiatement disponibles sur l’interface (filtres rapides), tandis que d’autres peuvent être sélectionnés en cliquant sur le bouton vert « Plus de filtres ».

Voici une explication rapide de tous les filtres disponibles pour les URLs :

URL : identifie les URLs qui contiennent (ou ne contiennent pas) un texte. Par exemple, le filtre rapide « Contenant des tirets bas » vous permet de trouver rapidement toutes les URLs affichant cette caractéristique. Il s’agit là de quelque chose de particulièrement important, sachant que Google recommande d’utiliser des traits d’union au lieu des tirets bas dans les URLs.

Nombre de paramètres : filtre les URLs en fonction d’un nombre spécifique de paramètres. Notez que les URLs qui ont plus de 3 paramètres sont à éviter : elles sont en effet extrêmement vulnérables face aux problèmes de duplicate content. C’est pourquoi nous avons créé le filtre rapide « Au moins 3 paramètres ».

Nombre de répertoires : filtre les URLs en fonction d’un nombre précis de répertoires. Grâce au filtre rapide « Au moins 3 répertoires », vous pouvez trouver les URLs qui se situent au plus profond de l’architecture du site et qui risquent de ne pas être crawlées aussi souvent par Google (voire pas du tout) que les URLs situées plus haut dans la structure.

Rapport Top-10 : indique combien de mots-clés du Top-100 se classent également sur la première page de résultats de Google. Le filtre rapide « Peu de hauts classements », par exemple, vous montre toutes les URLs qui se classent sur la première page organique avec moins de 3 % de leurs mots-clés dans le Top-100 : vous pouvez ainsi décider si vous voulez que ces URLs figurent dans l’index de Google.

Contenant les IDs de la session : filtre les URLs qui contiennent (ou non) les ID de la session. Notez que les ID de session peuvent facilement causer des problèmes de duplicate content. Il pourrait donc être judicieux de vérifier pourquoi votre système fournit des ID de session aux utilisateurs et au GoogleBot.

Contenant des majuscules : n’affiche que les URLs qui contiennent des majuscules. Il est toujours préférable d’éviter les majuscules dans les URLs ; les lettres majuscules et minuscules correspondent en effet à des URLs techniquement différentes qui risquent de générer des problèmes lorsqu’il s’agit de mettre en place des redirections 301.

Cryptage SSL : indique les URLs qui utilisent (ou n’utilisent pas) de protocole HTTPS. Cela est particulièrement utile pour les URLs qui ne sont pas encore sécurisées (filtre rapide : « Sans SSL »).

AMP : filtre toutes les URLs mobiles qui sont des pages AMP.

Tableau de classement des URLs

Nous pouvons maintenant passer à la partie la plus importante de cette section : la liste des différentes URLs pour le domaine évalué.

Pour chaque URL 1 la Toolbox indique le nombre de mots-clés qui se classent dans le Top-10 2 et le Top-100 3 des résultats de Google. Par défaut, le tableau est organisé en fonction du nombre de mots-clés classés dans le Top-100. Vous pouvez changer cette configuration en cliquant sur l’en-tête de la colonne. Si vous souhaitez visiter une URL spécifique, vous pouvez cliquer sur l’icône de la flèche pour ouvrir la page dans un nouvel onglet.

Dans la dernière colonne, nous vous montrons comment chaque URL contribue à la visibilité totale du domaine. 4

Analyse détaillée d’une URL unique

Pour analyser une URL unique dans la Toolbox, vous pouvez soit la saisir dans la barre d’outils, soit la sélectionner dans le tableau des URLs.

Dans ce dernier cas, il vous suffit de placer votre souris à la fin de l’URL que vous souhaitez analyser, puis de cliquer dessus.

En fonction de l’endroit où vous cliquez, la Toolbox ouvre le host, le chemin d’accès ou l’URL entière. Vous verrez toujours quelle partie de l’URL est sélectionnée.

Vue générale d’une URL

Après avoir cliqué sur l’URL, vous obtiendrez une vue d’ensemble contenant les KPI les plus importants, comme l’Indice de Visibilité, le nombre de mots-clés classés, les links et les social signals.

Notez que ces KPI couvrent les données desktop, mobiles, hebdomadaires et quotidiennes. Pour en savoir plus sur cette section, veuillez consulter notre tutoriel : « Utiliser la vue d’ensemble du domaine pour obtenir un résumé rapide de sa performance » .

Pour évaluer un autre « niveau » de l’URL (par exemple ses répertoires), vous pouvez cliquer sur les liens contenus dans la notice jaune située en haut de la page.

Utilisez le menu de gauche pour approfondir l’analyse de l’URL. Les évaluations suivantes pourront vous être utiles, surtout si vous ne savez pas par où commencer.

Indice de Visibilité d’une URL

Dans la section « Indice de Visibilité », vous pouvez évaluer la visibilité quotidienne et hebdomadaire pour desktop et mobile : y a-t-il des problèmes techniques qui nuisent aux performances en ligne de l’URL ? Sa visibilité mobile est-elle au même niveau que sur desktop, ou des améliorations sont-elles à envisager ?

Notez que de nombreuses URLs individuelles auront un Indice de Visibilité de zéro. Dans ce cas, il est préférable d’évaluer le répertoire dans lequel se trouve l’URL.

Pour en savoir plus sur l’Indice de Visibilité, n’hésitez pas à lire l’article suivant : « Qu’est-ce que l’indice de visibilité SISTRIX ? »

URLs référencées par mot-clés

Une URL peut (et doit) se référencer pour plus d’un mot-clé dans Google : la section « Mots-clés » vous permettra de tous les visualiser afin de commencer votre analyse de recherche de mots-clés.

Vous pouvez également cliquer sur la section « Changement Ranking » pour voir si l’URL a gagné ou perdu des mots-clés, ou si des changements sont intervenus dans son classement organique sur Google.

Enfin, vous pouvez cliquer sur la « Répartition ranking » de l’URL, qui vous montrera la répartition du Top 100 dans les pages de résultats de Google.

Liens d’une URL

Il peut également être intéressant de savoir pour chaque URL, combien elle comporte de backlinks, d’où ils proviennent, et s’ils constituent réellement un avantage pour le domaine ? Vous trouverez ces informations dans le module « Links » de la Toolbox.

Backlinks pointant vers l’URL

Comment voir les pages indexées d’un domaine

Grâce à la Toolbox, vous pourrez évaluer le nombre de pages indexées d’un site Web, une démarche extrêmement utile pour savoir si Google rencontre des difficultés lors du processus d’indexation. Dans cette section de la Toolbox, vous pourrez découvrir l’évolution historique des pages indexées pour un domaine dans le passé. Cette fonctionnalité peut être activée non seulement pour un domaine, mais aussi pour un répertoire, un sous-domaine ou un host.

Comme nous l’avons expliqué précédemment dans cet article, vous pouvez accéder aux pages indexées d’un domaine à partir de la section « URL ». Après avoir écrit le nom du domaine dans la barre de recherche, sélectionnez l’entrée « URL » 1 du menu de gauche. Cliquez ensuite sur la flèche grise située dans le coin supérieur droit de l’écran, près du bouton desktop 2 puis sur « Pages indexées » 3.

Vous pouvez aussi simplement cliquer sur l’entrée « Pages indexées » depuis la vue d’ensemble du domaine, à l’intérieur de l’encadré « Vues d’ensemble des domaines ».

La Toolbox n’indique pas le nombre de pages indexées si le domaine a un score de visibilité inférieur à 1 point. Toutefois, vous pouvez cliquer sur « Recueillir les données ». À partir de maintenant, la boîte à outils les évaluera pour vous.

Dans la section « Pages indexées », vous verrez un graphique contenant le nombre de pages que Google a indexées pour le domaine que vous évaluez.

Ces valeurs sont recueillies par le biais d’un site:requête du domaine sur Google. Pour la capture d’écran ci-dessus, cela donnerait site:coollibri.com.

Ces valeurs sont, de l’aveu même de Google, des estimations très approximatives susceptibles de varier. Pour repérer les valeurs aberrantes les plus importantes, nous interrogeons ces données plusieurs fois par semaine et calculons la moyenne.

Cependant, ce tableau se révèle très utile pour détecter si Google a des problèmes d’indexation du site. Si vous remarquez que le nombre de pages indexées baisse soudainement, vous devez immédiatement vérifier votre site Web afin de savoir si le GoogleBot est bloqué et ne peut effectuer l’indexation.

Graphique des pages indexées du domaine

Vous pouvez également utiliser l’icône <i class= »fas fa-cog » style= »color:#888″> située dans le coin supérieur droit du graphique pour modifier les épingles d’évènement, télécharger le graphique sous forme de fichier PDF, PNG ou CSV, le comparer avec un autre graphique ou l’ajouter dans un tableau de bord ou un rapport.

Il n’est pas possible de télécharger ou d’exporter la liste de toutes les URLs indexées d’un domaine. Toutefois, vous pouvez télécharger la page entière au format PDF ou exporter le tableau et le nombre de pages indexées.

Le tableau situé sous le graphique vous indique la valeur maximale, minimale et actuelle des pages indexées pour le domaine ainsi que la date du dernier crawl.

Enfin, lorsque vous utilisez la fonctionnalité « Add to Watchlist »  pour le domaine, nous interrogerons les données des pages indexées au moins une fois par semaine, même pour les petits domaines.

28.10.2022