Comment analyser la cannibalisation des mots-clés et des URLs

La cannibalisation des mots-clés et des URLs fait référence aux effets souvent négatifs qui se produisent lorsque deux publications, ou plus, du même domaine sont positionnées sur la même page de résultats Google.

Résoudre ce problème peut améliorer la visibilité du domaine. Dans ce tutoriel, nous vous montrerons comment identifier et résoudre les problèmes de cannibalisation pour obtenir un meilleur classement.

Étude de cas : la cannibalisation d’un site e-commerce

Nous aborderons par la suite plus en détail les différents types de cannibalisation et vous montrerons les différentes façons dont ils peuvent être évalués et résolus. Mais avant tout, nous aimerions vous présenter un exemple très courant où une boutique en ligne est en concurrence avec ses propres catégories et pages de produits. Cela illustre bien ce que signifie exactement la cannibalisation et pourquoi c’est un problème.

Sélectionner le domaine et afficher la cannibalisation

Commençons par saisir le nom de domaine asos.com dans la barre de recherche de la Toolbox.

Dans le menu de navigation à gauche, cliquez sur « Mots-clés » 1.

Dans la liste des résultats, nous commençons par cliquer sur le filtre « Montrer la cannibalisation des mots-clés » 2. Cela recherche tous les mots-clés pour lesquels au moins deux résultats de domaine apparaissent dans les résultats de la recherche.

Dans de rares cas, lorsque vous avez des domaines plus grands avec de nombreux mots-clés, ce filtre n’est pas affiché car la quantité de données est trop importante. Essayez alors de sélectionner une zone spécifique du domaine – par exemple, un répertoire ou un sous-domaine – et analysez-la à la recherche d’une éventuelle cannibalisation des mots-clés.

En cliquant sur la colonne « Volume de recherche » 3, la liste peut être triée par ordre décroissant, en fonction du volume de recherche le plus élevé.

Une fois le filtre sélectionné et la liste triée, vous pouvez afficher les autres classements à côté du mot-clé 4, dans la colonne sur la droite 5, et ainsi voir quelles URLs du domaine se classent pour ce mot-clé.

Affiner la liste des mots-clés cannibalisants

Dans la plupart des cas, nous vous conseillons d’ignorer les mots-clés de la propre marque dans votre évaluation, car avec ces recherches de sites Web, on peut supposer que le domaine apparaît plusieurs fois dans les SERPs.

Pour exclure des mots-clés de la marque, sélectionnez d’abord le filtre « Mot-clé » à l’aide du bouton vert « Filtrer » 1, puis sélectionnez l’option « Ne contient pas le texte » 2 et entrez-y le nom de la marque.

Ainsi, dans notre cas, nous avons choisi de ne pas inclure le texte « asos » dans les mots-clés.

De plus, il convient de limiter l’analyse des mots-clés cannibalisants aux 10 premiers. Avec un filtre de position 3, par exemple, les résultats peuvent être réduits à la position comprise entre 6 et 10 4.

Tableau des résultats pour une recherche de mots-clés sur le domaine asos.com avec le filtre Ne contient pas et la position

On retrouve désormais dans un tableau les URLs de différents répertoires comme (en plus de /fr/) /femme/, /homme/ mais aussi des répertoires de marques ou le répertoire /robe/. Nous recherchons des termes de recherche avec un volume de recherche élevé qui peuvent être clairement mappés à un mot-clé et classés pour une sous-catégorie ou une page de produit directe.

Dans de nombreux cas, la structure des pages du domaine analysé permet également d’évaluer les répertoires individuellement. Par exemple, sur asos.com, nous pouvions uniquement consulter les résultats du répertoire /femme/ ou même ceux de /femme/pantalon/.

Tout au long de cet article, nous allons analyser différents scénarios. Dans ce cas, la première tentative d’optimisation consisterait à ajuster les liens internes des URLs classées.

Qu’est-ce que la cannibalisation en matière de SEO ?

La cannibalisation par mot-clé est un phénomène qui se produit fréquemment lorsque vos propres résultats sont en concurrence les uns avec les autres et provoque une division sur les concepts-clés tels que :

  • Le CTR organique
  • Les liens internes ainsi que les liens externes
  • Le contenu
  • Le trafic
  • Les conversions

Parfois, la cannibalisation se produit inconsciemment parce que les projets n’ont pas de structure solide ou parce que la stratégie de contenu est plus improvisée que planifiée. Le résultat est un contenu très similaire concernant le même mot-clé.

Ce phénomène se produit également sur les sites de grande taille parce ceux-ci génèrent de grandes quantités d’information ou de contenu. Ces contenus se répètent parfois ou se dupliquent avec différentes URLs qui traitent le même sujet.

À noter que la cannibalisation peut également parfois survenir involontairement parce qu’un site Web jouit d’une très grande autorité. Le moteur de recherche montre plusieurs résultats du même domaine, ce qui peut répondre à des intentions de recherche ambiguës.

On pourrait aussi évoquer des situations de cannibalisation qui se produisent sur la première page de Google, pouvant sans doute être « positives » pour occuper deux positions et ainsi augmenter la probabilité d’obtenir un meilleur CTR.

Par conséquent, il est nécessaire de surveiller les cas dans lesquels la cannibalisation a lieu dans des pages plus profondes car elle pourrait provenir d’un problème de structure de page. Ces pages enverront à Google et aux moteurs de recherche des signaux contradictoires qui pourraient les conduire, par exemple, à positionner plusieurs URLs différentes pour un même mot-clé, en changeant leur position chaque semaine.

Types de cannibalisation

Il existe de nombreux cas différents pour lesquels la cannibalisation des mots-clés peut se produire. Nous les avons regroupés comme suit :

  • Différentes URL sont positionnées pour le même mot-clé :
    • Les URLs ont des objectifs différents
    • Les URLs ont le même objectif
  • Deux URLs différentes alternent dans le classement :
    • En raison d’un problème structurel
    • En raison d’un problème d’intention de recherche
  • Titres ou meta descriptions en double, contenant le même mot-clé

Comme nous l’avons mentionné précédemment, il y a des cas dans lesquels une cannibalisation est positive. Cela permet d’obtenir une « saturation des résultats de recherche » plus élevée, intentionnellement obtenue dans le but d’occuper le plus de résultats possible dans les SERPs utilisant des contenus différents pour différentes intentions de recherche.

Les cannibalisations négatives seraient celles dans lesquelles :

  • Une URL qui ne correspond pas à l’intention de recherche appropriée se classe. Par exemple, lorsqu’un article de blog est positionné à la place d’une fiche produit.
  • Les URLs qui dupliquent le contenu sont positionnées en raison de défauts structurels comme lorsque des filtres sont positionnés au lieu de catégories.

Impacts de la cannibalisation

Tout projet SEO peut être affecté par la cannibalisation. Voyons maintenant les effets (négatifs) les plus importants :

  • Diminution de l’autorité : étant donné qu’il existe plusieurs URLs qui se classent pour le même mot-clé, des métriques seront divisées entre les deux (ou plus), notamment le CTR, le trafic et l’autorité qui devraient être recentrés sur une seule URL.
  • Dilution des signaux de liens internes et externes : la consolidation des signaux provenant des liens internes et externes n’est pas possible lorsqu’il y a plusieurs URLs qui se positionnent pour le même mot-clé ou couvrent la même intention de recherche. Lors de l’utilisation d’un texte d’ancre, la question à se poser est : lequel sera le plus pertinent pour chaque URL si les deux traitent des mêmes sujets ?
  • Division du crawl budget : avoir plusieurs pages dédiées au même mot-clé fera que ces URLs seront indexées et crawlées deux fois, inutilement, en particulier sur les sites Web de moyenne et grande taille.
  • Division et diminution la conversion : En ayant plusieurs pages pour le même sujet ou pour la même « intention de recherche », il est très probable que l’une d’elles soit meilleure que les autres. Le fait qu’il y a d’autres pages classées pour les mêmes mots-clés, pourrait faire perdre l’attractivité vers la « bonne page » et par conséquent, les ventes qui en découlent.
  • Visibilité inférieure : imaginez deux URLs d’un domaine occupant les positions 9 et 12. Se concentrer sur une seule URL peut faire apparaître cette URL plus haut sur la première page.

Comment résoudre les problèmes de cannibalisation ?

Vient ensuite le plus intéressant : que peut-on faire pour résoudre les problèmes liés à une cannibalisation ? D’abord, vous devez le trouver. Nous l’avons déjà fait ci-dessus dans l’exemple, ci-dessous nous expliquerons en détail les différentes façons de le faire.

Une fois la cannibalisation identifiée, il existe plusieurs façons de la résoudre. La bonne option dépendra du type de cannibalisation auquel vous êtes confronté et des ressources dont vous disposez pour la résoudre.

Par exemple, vous pouvez avoir besoin de l’aide de l’équipe éditoriale pour modifier le contenu ou ajuster les liens internes. Cependant, la mise en place de redirections peut impliquer une intervention au niveau de l’administration du site Web.

Structure des liens internes

Les liens établis entre différentes pages d’un même domaine se sont souvent développés de manière organique et sans plan préalable. Ainsi, les liens internes sont très souvent un outil puissant dans l’arsenal d’un professionnel du SEO. Les liens internes à partir du contenu adéquat et avec des textes d’ancre bien compréhensibles sur les pages importantes permettent à Google et aux utilisateurs de reconnaître une connexion significative à la structure de la page, même s’il n’y a pas beaucoup d’autres liens.

Il est souvent possible d’indiquer clairement à Google quelle URL est la plus adaptée à chaque mot-clé en utilisant un maillage interne strict, sans avoir à ajuster le contenu des URLs.

Dans notre article « Les bases en SEO : Optimisation des liens internes » vous avez la possibilité d’apprendre tout ce que vous devez savoir sur les liens internes et ce que vous pouvez apprendre de Wikipédia.

Fusionner le contenu

S’il existe plusieurs pages sur le même sujet qui ont le même objectif, par exemple des reportages différents sur une même destination de vacances, l’idéal est de regrouper tous vos efforts sur une seule URL. Cela évite d’avoir différentes pages sur le même sujet en concurrence les unes avec les autres. Ainsi, il n’y a qu’une seule page qui regroupe tous les signaux de confiance. Vous pouvez le faire de la manière suivante :

  • Canonical : cette balise donne à Google un indice clair quant à l’URL qui doit être considérée comme la source. Cette méthode n’est pas toujours idéale car ce n’est qu’un indice pour Google et Google peut ne pas la suivre. Cependant, l’utilisation de la balise canonical est toujours utile s’il existe plusieurs entrées similaires ou identiques sur différentes URLs qui doivent encore être appelées individuellement (par exemple, en tant que page de destination pour différentes campagnes telles que le marketing par e-mail, les réseaux sociaux, etc.).
  • Redirection : En redirigeant une URL vers une autre, les deux contenus sont fusionnés en un seul, à ce stade, il serait peut-être intéressant de vérifier :
    • Quel contenu est le mieux positionné ou avec les meilleures métriques ?
    • Quel contenu répond le mieux à l’intention de recherche ?

De cette façon, en focalisant tout sur une seule URL, tous les signaux sont optimisés pour pointer directement vers l’URL choisie.

Supprimer des contenus

Une autre façon d’éviter la cannibalisation consiste à nettoyer le contenu en double ou utilisé de manière chaotique. Si le contenu est identique ou presque identique, il peut être supprimé. Ceci tant que les messages individuels n’ont pas de métriques de réussite (telles que des visiteurs, des classements ou des backlinks qui leur sont propres). Si tel est le cas, le point « Fusionner le contenu » devrait être appliqué.

Cependant, si le contenu doit vraiment être supprimé, plusieurs possibilités s’offrent à vous :

  • Noindex : Si nous voulons garder le contenu actif pour d’autres canaux que le SEO, nous pouvons utiliser « noindex » pour faire ressortir ce contenu de l’index Google. Pour le reste, il faut faire attention à l’utilisation prolongée du « noindex » pour éviter les problèmes de répartition des autorités internes et de budget crawl.
  • 404 ou 410 : L’option d’éliminer complètement le contenu est également possible, tant qu’il s’agit de pages qui n’ont généré aucun résultat et que nous pouvons « nettoyer » pour éviter la cannibalisation et faire indexer de nombreux contenus sur le même sujet. Voici deux articles pour en savoir plus sur les codes 404 et 410.

Comment détecter la cannibalisation ?

Au début de ce tutoriel, nous avons déjà vu un exemple de cannibalisation avec SISTRIX. Cependant, pour identifier et détecter quelles URLS et mots-clés sont impliqués dans la cannibalisation de notre projet, nous pouvons utiliser plusieurs méthodes ou moyens :

Recherche manuelle avec opérateurs de recherche

Tout d’abord, nous pouvons utiliser la fameuse commande « site » pour vérifier quels contenus déjà indexés dans Google sont similaires pour une recherche spécifique. La recherche peut être encore affinée à l’aide d’autres opérateurs de recherche :

intitle : pour filtrer les mots-clés contenus dans le titre des URLs.

inurl : pour filtrer les mots-clés contenus dans la structure des URLs.

Un exemple :

site:monsite.com + « keyword »

site:monsite.com + inurl: »keyword »

site:monsite.com + intitle: »keyword »

Google Search Console

Vous pouvez également analyser la cannibalisation à l’aide de la Google Search Console. Pour cela, dans la section Performances, ajoutez la requête et sélectionnez l’onglet « Pages » afin d’identifier toutes les URLs qui reçoivent des impressions et des clics via cette même requête.

On observe que les URLs apparaissent à des positions proches les unes des autres. Le dénominateur commun est que le CTR est faible, soit en raison du manque d’optimisation du snippet affiché, soit du fait que les contenus se font concurrence.

Astuce : Vérifiez également s’il y a eu des changements dans le contenu ou la structure du site Web pendant la période d’évaluation, comme par exemple l’ajout de plusieurs répertoires de pays pour la même langue.

Moteur de recherche interne

Parfois, le moteur de recherche interne peut nous aider à détecter les résultats similaires, répétés ou qui répondent à la même recherche. Et ceci, bien que cela dépende de la façon dont le moteur de recherche est configuré pour renvoyer les résultats : type de correspondance, critères de correspondance, si vous respectez ou non les majuscules ou minuscules, s’il prend en compte les attributs de pertinence et de signification, etc.

Par exemple :

Il y a plus de 1270 produits liés aux « armoire tiroir » comme vous pouvez le voir dans le moteur de recherche interne IKEA :

Résultat de la recherche pour Armoir tiroir dans le moteur de recherche du site Ikea.com

Si la gamme de produits avec cette caractéristique présente une profondeur si évidente, il serait peut-être intéressant de considérer cet attribut de manière à ce qu’il devienne une catégorie ou un filtre au sein du site et de centraliser cette intention de recherche.

Actuellement, la catégorisation des « placards » est limitée aux sous-types les plus évidents.

SISTRIX

Avec SISTRIX, comme déjà brièvement montré ci-dessus, vous pouvez également détecter la cannibalisation sur votre site. L’outil SISTRIX vous permet en effet de trouver des pages potentiellement cannibalisatrices de plusieurs manières. Voici trois façons de le faire.

1 – Utiliser l’historique des mots-clés pour identifier les moments où l’URL de classement a changé pour un mot-clé spécifique.

Nous utilisons le mot-clé et le nom de domaine 1 pour identifier l’historique des URL qui se sont positionnées chaque semaine ou jour.

Dans le tableau avec les URLs classées, vous pouvez rapidement voir si les URLs changent presque chaque semaine et occupent des positions différentes. Si nous voyons qu’un mot-clé a « la bougeotte » 2, c’est que différentes URLs se battent pour se classer.

Bien évidemment, dans ce tableau, nous identifierions déjà comment la gestion des filtres ou des paramètres interviennent dans le classement du répertoire en question.

2 – Utiliser la fonctionnalité « Changements d’URL »

La deuxième possibilité est l’évaluation via la fonctionnalité « Changements d’URL ». Vous pouvez la trouver dans le menu à gauche.

Tableau des résultats pour l'analyse des changements d'URL sur une semaine

Sur cette page, vous pourrez identifier rapidement les mots-clés dont l’URL a changé entre deux dates que nous avons choisies.

Tableau des résultats pour l'analyse des changements d'URL sur une semaine et avec un mot-clé contenant diamant

À l’aide des filtres, les résultats peuvent également être limités à certaines caractéristiques de mots-clés ou d’URL. Par exemple, seuls les mots-clés contenant le mot « diamant » dans la requête de recherche peuvent être affichés.

3 – Utiliser le filtre prédéfini « Montrer la cannibalisation des mots-clés« 

Nous avons déjà utilisé cette option dans notre exemple avec asos.com.

Tableau des résultats de mots-clés pour le domaine asos.com avec les filtres Montrer la cannibalisation et le mot-clé ne contenant pas "asos"

À l’aide de la fonctionnalité de filtrage « Montrer la cannibalisation des mots-clés », les résultats peuvent également être limités à certaines caractéristiques de mots-clés ou d’URL. Nous observons ainsi le nombre de mots-clés apparaissant pour plus d’une URL référencée. Ces données sont affichées à côté de la colonne de position en SERP.

Pour mettre en place ce filtrage, une fois le domaine renseigné dans la barre de recherche, cliquez sur « Mots-clés » dans le menu de navigation de gauche et sélectionnez le filtre prédéfini « Montrer la cannibalisation des mots-clés ». 

Si le filtre n’apparaît pas, cela signifie que la quantité de données du domaine que vous souhaitez analyser est trop importante. Dans ce cas, sélectionnez un hébergeur ou un répertoire spécifique de votre domaine et analysez cette zone spécifique.

Les résultats de cette évaluation peuvent ensuite être examinés pour mieux cerner son intérêt :

  • L’intention de recherche est ambiguë et plusieurs des URLs répondent à ladite intention de recherche
  • Le site Web a beaucoup d’autorité et apparaît avec plusieurs résultats bien placés
  • Le site Web présente un problème de cannibalisation ou de structure

Réduire les risques de cannibalisation

Vous devez non seulement résoudre la cannibalisation, mais vous devez également prendre des mesures préventives pour éviter les problèmes de cannibalisation. Une façon de les réduire, particulièrement utile pour les nouvelles pages pour lesquelles une stratégie d’optimisation est en cours d’élaboration, est d’ajuster la stratégie de création des articles et donc des URLs.

Ajustez votre plan de mots-clés

S’il n’y a pas une attention particulière portée sur une nouvelle requête de recherche de pages, il peut arriver que différents articles apparaissent, chacun couvrant des aspects partiels d’un domaine. Ces pages se font concurrence.

Exemple : Pour des termes plus génériques, il faudrait travailler avec un planning rédactionnel pour le contenu ou alors travailler beaucoup mieux avec la catégorie qui regroupe tous les articles et que chaque article cible le mot-clé spécifique correspondant.

D’autre part, il faut aussi tenir compte de la demande existante si elle se réfère plus à la longue traîne par exemple, ou si la majorité des recherches portent sur le terme générique, qui, d’ailleurs, dans ce cas, est en même temps une recherche de type Do et de type Website.

        Modifier des éléments clés du SEO

        Une fois le point précédent clarifié, il est temps d’optimiser commodément chaque contenu. Nous pouvons utiliser l’outil Keyword Discovery de SISTRIX pour une analyse rapide des mots-clés qui sont en demande et l’utiliser pour optimiser notre contenu ou en créer de nouveaux.

        Tableau des résultats pour une recherche de Keyword Discovery pour "screaming frog"

        Une fois les mots-clés sélectionnés transférés dans une liste, l’environnement du marché peut être facilement étudié.

        Liste de mots-clés pour un projet SEO autour des machines à café

        Vous obtiendrez un tableau avec les informations les plus importantes sur le mot-clé qui vous intéresse. Dans la barre de navigation de gauche, vous trouverez plusieurs options de menu supplémentaires.

        Analyse des caractéristiques SERP d'une liste

        Par exemple, vous pouvez voir quelles fonctionnalités SERP sont souvent affichées à côté des résultats organiques. C’est une information à prendre en compte lors de la création des articles et contenus pour de meilleurs résultats SEO.

        Vous pouvez trouver plus d’informations sur l’utilisation des listes dans notre tutoriel Fonctionnalités des listes dans SISTRIX : idées et exemples.

        Grâce à ces informations, vous pouvez évaluer la page de résultats en fonction des différents indices et créer un tableau d’optimisations adaptées aux besoins.

        Exemple de tableau d’optimisation

        TypeMot-clé cibléIntentionTitre
        Catégoriescreaming frogmixedTout savoir sur Screaming Frog en français
        Articleaudit screaming frogDOComment faire un audit avec Screaming Frog
        Articleastuces screaming frogDOLes meilleures astuces avec Screaming Frog
        Articlescreaming frog crawl depthDOQu’est-ce que c’est et comment analyser la crawl depth de Screaming Frog
        Articlesitemap screaming frogDOComment analyser et créer des sitemaps avec Screaming Frog

        À ce tableau, nous pourrions ajouter la méta-description, l’URL et un H1. Nous devrions ensuite élaborer une stratégie de linking interne pour améliorer les textes d’ancrage dans chaque cas et le renforcer au niveau 1, qui est ici la catégorie, en utilisant le fil d’ariane par exemple.

        Nous espérons que vous pourrez désormais détecter et résoudre toutes les situations de cannibalisation SEO !

        17.01.2024