Un plan de site (ou sitemap) est une liste de toutes les pages (adresses URL) d’un site Internet. Les moteurs de recherche utilisent ce fichier pour avoir un aperçu de tout le contenu disponible et ainsi mieux comprendre la structure du site.
Si on crée un plan de site XML pour son site, on peut aider les moteurs de recherche à trouver des pages qu’ils n’auraient peut-être pas trouvées sinon. Par exemple, parce que le site ou l’adresse URL est trop récent et n’a que très peu de liens entrants, ou parce que la page est nichée profondément dans le site.
En créant un plan de site HTML on montre son soutien aux moteurs de recherche pendant leur exploration de son site. De plus, les plans de site HTML ont des avantages pour les utilisateurs puisqu’ils augmentent la maniabilité du site.
Un plan de site XML est aussi utile pour les moteurs de recherche. Et, bien qu’il ne soit pas certain que toutes les pages soient explorées, il aidera dans l’identification des nouvelles pages et des pages qui sont nichées profondément dans le site.
Il est important de noter que seules les pages indexées par les moteurs de recherche peuvent être ajoutées à leur index pour ensuite apparaître dans les pages de résultats. Tous les webmasters devraient donc avoir un plan du site HTML sur leur site et le soumettre à Google et Bing.
Avoir un plan de site XML ne garantit pas que toutes les adresses URLs soient indexées
Créer un plan de site XML n’est pas difficile et tous les webmasters devraient en avoir un pour les moteurs de recherche. On peut voir le plan de site comme un bon outil qui peut aider Googlebot à trouver du contenu plus facilement. Mais le simple fait d’avoir un plan du site ne garantit pas que Google va aussi indexer toutes les pages disponibles sur le site.
L’algorithme de Google pour l’exploration et l’indexation de sites choisit les adresses URLs qui seront indexées. Si l’algorithme pense que le contenu est « mince », ou qu’il est de mauvaise qualité, l’adresse URL ne sera pas indexée.
En premier lieu, soumettre un plan de site ne garantit pas que toutes les pages référencées dans celui-ci seront indexées. Vois le plan de site comme un moyen d’aider Googlebot à trouver le contenu. Si les adresses URLs n’étaient pas inclues dans le plan de site, les robots d’exploration mettraient plus de temps à les trouver et donc leur indexation serait plus lente aussi.
Faites aussi attention parce que, parfois, les algorithmes décident de ne pas indexer du tout certaines adresses URLs. Par exemple, si le contenu est superficiel, il peut être soit entièrement indexé ou il peut être soit pas du tout indexé.
Gary Illyes, ingénieur chez Google, forum d’aide pour les Webmaster