Doctolib : une santé SEO thématisée YMYL

Et si on vous disait qu’il possible de passer au-dessus des box de Google ou des réponses directes (direct answer) « dictionnaires » sur des mots-clés génériques ? Mieux encore, que ces mots-clés ont des dizaines de recherches mensuelles ? Et si en plus on vous dit que c’est sur un site français thématisé YMYL…alors là…c’est le pompon. Et bien, Doctolib l’a décroché, je vous explique comment.

Doctolib, c’est l’histoire de Stanislas Niox-Chateau, Steve Abou-Rjeily, Jessy Bernal et Ivan Schneider qui veulent résoudre le problème des praticiens médicaux en ce qui concerne la gestión de leurs tâches administratives.

L’aventure Doctolib démarre en aout 2013 et la visibilité en page de résultat du moteur de recherche (SERP) dès décembre 2013 :

Visibilité en SERP desktop Doctolib
Visibilité en SERP desktop Doctolib.fr

Totalement inconnu, il y a 7 ans, Doctolib est parvenu à s’imposer tant auprès de la communauté des professionnels de la santé, médecins et autres, que des patients. Aujourd’hui, plus de 610 000 mots-clés à fort volume  référencent le site en ligne :

Des keywords à fort trafic très visible pour doctolib.fr
Des keywords à fort trafic très visibles pour doctolib.fr

Quelle est la colonne vertébrale de ce site valorisé plus d’un milliard d’euro

Répertoires

Le site a organisé sa structure en répertoires par spécialité médicale. Nous observons que le SEO se concentre sur peu de métiers qui « drivent » l’essentiel de la visibilité :

Parmi les dizaines de répertoires, SISTRIX montre les 25 plus visibles.

Visitons le répertoire le plus puissant au niveau visibilité, celui concernant les médecins généralistes.

Comme on peut l’observer avec quelques-uns des « updates » Google de ces dernières années, concernant la thématique, en général, le répertoire le plus puissant du site influence en grande partie la visibilité du domaine. En effet, s’il subit une chute de visibilité via, par exemple, la mise à jour de Google, il entraine avec lui tout le domaine.

Dans ce répertoire, Doctolib dispose de 92.630 mots clés très bien référencés. A titre d’exemple, sur le keyword « médecins généralistes » (90 500 recherches par mois), Doctolib parvient souvent à réaliser la performance d’être parfois, simultanément, à la première place dans deux catégories mesurées par Google : les PAA (People Also Asked ou Questions) et/ou les Actualités.

Le mot-clé « médecin généraliste » référencé par Doctolib

Les sous-domaines

Les sous-domaines de Doctolib

Hors mis le www., les sous-domaines ne semblent pas être la pièce maitresse du référencement du site servant à gagner de nouveaux utilisateurs. Il s’agit la plupart du temps de requêtes avec intention de recherche Website, avec des keywords de marque (également appelés « branded »)

Les URLs

A contrario des répertoires, nous pouvons observer que la première URL la plus visible sur moteur de recherche (en excluant la page d’accueil) est celle concernant les laboratoires. Intéressant, car on découvre une autre activité du site qui lui permet de se référencer sur pas moins de 136 keywords en top 10 et 214 en top 100.

En troisième position, nous retrouvons le répertoire de médecine générale, avec, pourtant un nombre de mots-clés en top 10 et top 100 pourtant plus élevé. Alors pourquoi /medecin-generaliste est-il moins visible que /laboratoire ?

La réponse se trouve dans plusieurs facteurs qu’analyse SISTRIX :

  • Le volume de recherche sur chaque keyword : plus de keywords mais moins de volume réduit sa visibilité.
  • La position en SERP : plus bas dans la SERP est égal à moins de visibilité.
  • Les SERP Features : si Google a des affichages de ses propres produits (Maps, Questions,…) il y a moins de visibilité.
  • Le CTR de chaque position sur chaque mots-clés permet même de connaitre le trafic estimé sur /laboratoire et sur /médecin généraliste.

Encore une fois, le diable se cache dans les détails. Je rappelle ici que nous sommes en train d’analyser l’URL et pas le répertoire /médecin-généraliste/ ce dernier disposant du slash final.

Maintenant que nous connaissons les bases du site et les résultats en SERPs, regardons comment Doctolib s’y est pris pour ranker.

Le rapprochement avec l’historique mondocteur.fr ?

En juillet 2018, le fondateur annonce que Doctolib se rapproche de son ainé MonDocteur.fr. On s’attend à une migration afin de mutualiser les efforts sur un seul site. Cela a-t-il joué en sa faveur ?

Migration en bonne et due forme de mondocteur vers Doctolib ?

Lors d’une migration, il est courant d’observer un transfert régulier de la visibilité, souvenez-vous des cas SEO Blablacar ou CanalPlus par exemple. Ici, il semble que le site se soit arrêté net et qu’il n’y ait pas eu de transfert de visibilité.

Intriguant, non ?

Toutefois, comme le souligne l’expert français en migration de site :

Il est fréquent d’observer des migrations qui « trainent » dans leur prise en compte par Google. En effet pour que Google comprenne bien l’intégralité des redirections il faut qu’il les découvre fréquemment, Cependant, ces anciennes URLs ne sont par définition plus maillés dans le gigantesque graph qu’est Internet. C’est d’ailleurs pour cela que les URLs qui reçoivent des backlinks sont souvent plus rapidement prises en compte. Une astuce pour réduire ce délai est de mettre en place un plan de site HTML qui force des liens vers les anciennes URLs jusqu’à prise en compte exhaustive des redirections.

Patrick Valibus, créateur de l’outil de migration Swan

Si l’on regarde la SERP avec la commande site: , nous observons que malgré les redirections, le site mondocteur.fr continue de ranker avec + de 570000 pages indexées.

mondocteur.fr continu de ranker en SERP
le site mondocteur.fr continu de ranker en SERP avec + de 570000 pages indexées

Essayons d’aller plus loin et d’atteindre, par exemple, le fichier robot : http://mondocteur.fr/robots.txt.

fichier robots.txt de mondocteur.fr

Google a réalisé un guide pour migrer d’un site ancien A vers un site B.

Il indique, notamment, comment supprimer toutes les instructions du fichier robots.txt pour permettre la détection des redirections et la mise à jour de l’Index. De même, pour les sites à gros volumes de pages, afin de contrôler la migration et en vérifier précisément les effets, il est possible de migrer par section. Par ailleurs :

À partir de l’ancien site, envoyez les deux sitemaps que vous avez créés auparavant, et qui contiennent les anciennes et les nouvelles URL.

Google Developers

Le Contenu Généré par l’Utilisateur

Le User Generated Content en anglais pour contenu généré pour l’utilisateur est utilisé à bon escient par DoctoLib. En effet chaque médecin qui s’inscrit sur le site a la possibilité de se créer une fiche d’identité avec, comme type de contenu, ses études et diplômes, l’adresse de son cabinet, son expérience professionnelle, et ses spécialités (entre autres types de contenu).

Champs disponibles pour ajouter et personnaliser du contenu chez DoctoLib.

Dans ce cas le professionnel de santé va donc apporter du contenu professionnel spécialisé sur sa fiche, qui sera publique et référencée pour moteur de recherche. Autrement dit, DoctoLib va bénéficier d’une visibilité supplémentaire au moindre coût grâce à du contenu généré par des personnes externes à l’entreprise. C’est ce que font aussi les réseaux sociaux, à l’image de LinkedIn ou Pinterest.

D’ailleurs, Olivier Duffez, fondateur de WebRankInfo (qui a commencé comme un forum SEO), nous rappelle que :

Les contenus générés par les utilisateurs sont appréciés en SEO car on estime (à tort !) qu’ils ne coûtent rien, parce qu’ils nous les offrent sur un plateau. En réalité, il faut les modérer, corriger éventuellement les fautes d’orthographe et surtout espérer que la qualité soit au rendez-vous. Mais ce qui est intéressant, c’est justement d’avoir les mots/expressions des utilisateurs qu’on veut faire venir sur notre site. Par exemple, laisser les internautes poser des questions à propos d’un produit sur un site ecommerce, c’est une super idée. Inciter les anciens clients (qui ont acheté ce produit) à y répondre est encore mieux. En effet, c’est toujours du contenu généré par les utilisateurs.

Olivier Duffez, fondateur de WebRankInfo

Ce concept n’est évidemment pas nouveau puisqu’en 2008 déjà, John Krumm de Microsoft Research aidé de Nigel Davies (Lancaster University) et Chandra Narayanaswami du centre de recherche d’IBM ont même mis en lumière différentes formes d’UGC : vidéos amateurs importées sur plateforme, évaluations/avis/commentaires de produits ou encore les forums, les wikis pour ne citer que quelques formes. Ou même, tant qu’on y est, on peut évoquer la collecte passive de données qui sont communiquées sur un serveur puis, transmises à une communauté d’autres utilisateurs comme le fait Waze ou Coyote par exemple dans le domaine routier.

Pour information, je rappelle que le CMS WordPress depuis sa version 5.3 applique, par défaut sur les commentaires de posts, l’étiquette :

rel="external nofollow ugc"

(Pour autant vous pouvez quand même commenter cet article, ça diversifiera vos types de lien :-P )

EAT : s’imposer comme l’autorité du secteur médical

Le concept E pour Expertise, A pour Autorité et le T de Trust pour Confiance est devenu incontournable dans le référencement d’un contenu. Allez-vous plutôt suivre les recommandations vidéos d’une personne lambda pour la baisse de votre vue ou plutôt le contenu développé par un ophtalmologiste ?

Ça y est vous avec compris ce qu’est le E.A.T. d’autant plus que, dans cet exemple, l’ophtalmologiste est un médecin, diplômé et certifié par l’État (ici l’autorité) qui plus est, spécialiste des yeux (ici l’Expertise) et que vous avez l’habitude de consulter en cas de pépin (ici la confiance).

Eh bien justement DoctoLib réussit la performance d’obtenir un contenu E.A.T. généré par les médecins eux-mêmes.

Ok. Seulement nous n’avons pas tous, l’équivalent de médecins prêts à écrire pour nous. Google nous aide à se poser les bonnes questions, nous allons les résumer et montrer comment on peut s’y prendre.

Contenu et qualité

Nous conseillons de fournir des informations, des rapports, des recherches ou des analyses originaux. Et, chaque fois que vous le pouvez, des descriptions substantielles, complètes ou exhaustives du sujet que vous traitez.

Incluez, lorsque vous le pouvez, des citations de qualité dans votre contenu et étayez vos affirmations par des faits provenant de sources fiables. Il s’agit de produire une analyse perspicace ou des informations intéressantes au-delà de ce qui est évident. Si le contenu s’appuie sur d’autres sources, il faut lui donner de la valeur ajoutée et en souligner l’originalité.

Sur la forme, il est conseillé de donner un titre à l’article et/ou de la page en évitant qu’il soit excessif ou choquant. On peut également ajouter à la page un résumé descriptif et utile du contenu.

En fait, le petit truc en plus est de toujours se demander si vous partageriez ou recommanderiez ce contenu à un ami ou encore si vous vous attendriez à voir ce contenu imprimé dans un magazine, une encyclopédie ou un livre ou même à y être référencé.

Expertise

Ici nous nous efforçons de présenter des informations d’une manière qui donne envie de s’y fier, en montrant qu’il s’agit d’une source claire disposant de preuves de l’expertise revendiquée. Posez-vous la question suivante, si vous deviez faire des recherches sur le site qui produit le contenu, auriez-vous l’impression qu’il est digne de confiance ou largement reconnu comme une autorité en la matière ? Il va donc falloir produire un contenu rédigé soit par un expert, soit par un passionné qui connait très bien le sujet.

Les biographies des auteurs ne suffisent pas. Idéalement, les auteurs doivent être de véritables experts (en particulier pour les sujets YMYL). En effet, le contenu YMYL doit être fondé sur des preuves, être objectif et faire l’objet de recherches approfondies.

Confiance

Il faut avoir le souci de produire un contenu propre, sans problèmes d’orthographe ou de style. Evitons de laisser penser qu’il a été produit à la va-vite. Evitons également les publicités intempestives qui détournent l’attention ou interfèrent avec le contenu principal et même les liens d’affiliation ou le langage « vendeur » (surtout pour du contenu YMYL). Et, n’oublions pas de vérifier que l’affichage de notre contenu reste correct sur dispositif mobile.
Enfin, le contenu est-il produit en masse ou sous-traité à un grand nombre de créateurs, ou réparti sur un vaste réseau de sites, de sorte que les pages ou sites individuels ne reçoivent pas autant d’attention ou de soins ?

Prenez donc bien en compte l’EAT dans le contenu de votre site, ce n’est pas pour rien que Google le mentionne 137 fois dans les directives pour les évaluateurs de la qualité des recherches de novembre 2020.

DoctoLib à la conquête de l’Europe

Grâce à ses différentes levées de fond, DoctoLib s’étend à l’étranger. Et pour commencer, en particulier, en Allemagne :

Visibilité mobile France et Allemagne de DoctoLib
Visibilité mobile France et Allemagne de DoctoLib

Observons d’emblée que la visibilité de la version mobile (Mobile first index oblige, SISTRIX dispose de deux bases de données : Mobile et Desktop) en Allemagne est moindre.

Des sources en interne, nous expliquent que leur premier objectif est d’être plus visible que leur plus grand concurrent en Allemagne. De ce fait, les différentes équipes gèrent les canaux d’acquisition de trafic en arbitrant en permanence entre les campagnes et projets de court et de long terme. On nous fait part que l’une des difficultés est parfois de «trouver les bons arguments et chiffrer l’impact pour prioriser les chantiers pour débloquer du budget».

La recette de la licorne santé ?

Nous venons de voir comment un domaine récent peut devenir leader sur son marché en 6 ans et attirer des millions de visites. Cela est possible même sur une thématique YMYL pour Your Money Your Life (la thématique santé dans cette étude de cas). Les facteurs de succès reposent sur les différents piliers du référencement, à commencer par un site très bien structuré et sans (ou peu) d’erreurs techniques (Optimizer), du contenu de qualité (même en UGC) en phase avec les recommandations E-A-T.

Dans le contenu on doit citer des produits et services efficaces et utiles qui apportent de la valeur à leurs utilisateurs (Dans notre cas, aussi bien le patient que le professionnel). Et puis un grand nombre de liens avec un profil propre obtenus en nombre. Le tout, combiné au Machine Learning de Google, permet de comprendre pourquoi notre licorne française caracole sur les sommets des SERPs du Grand G.

Articles similaires