Top
Aurélien Quichaud / SEO  / Pourquoi des pages de mon site se désindexent de Google ?
Pourquoi une page se désindexe de Google

Pourquoi des pages de mon site se désindexent de Google ?

Votre site possède des centaines, voire des milliers de pages. Un jour, vous constatez une chute de trafic soudain. Vous vous connectez alors à votre Google Search Console et vous déplorez une désindexation soudaine de plusieurs pages. Plusieurs raisons peuvent expliquer pourquoi des pages de votre site se désindexent de Google, sont « déréférencées ».

1. Un problème technique de Google lui-même

Parfois, il arrive que Google lui-même fasse l’objet de problèmes techniques, de bugs qui se traduisent par la désindexation d’une ou de plusieurs dizaines de pages du moteur de recherche. Il m’est souvent arrivé d’être confronté à cette situation.

Dans la grande majorité des cas (et heureusement !) la situation se rétablit d’elle-même en seulement quelques heures. Cette situation peut néanmoins durer plusieurs jours. Dans ce cas-là, la solution (qui a fonctionnée pour moi) est d’envoyer manuellement son ou ses URL à Google via la Google Search Console pour qu’il les rescanne et les réindexe rapidement.

Si ce problème concerne trop de pages, il est également possible de supprimer le sitemap et le renvoyer. Cette action a pour but d’inciter Google Bot à crawler votre site entièrement (ou dans la limite de son budget).

Ce problème n’est donc pas lié à une erreur technique de votre part, mais bien de Google lui-même. L’impact peut-être préjudiciable lorsque les pages désindexées par Google sont des pages à fort taux de conversion et trafic élevé…

2. Une mauvaise utilisation des balises noindex

La deuxième raison qui peut expliquer une désindexation soudaine de vos pages dans Google est une mauvaise utilisation de la balise <meta name= « robots » content= « noindex »>.

Commencez par vérifier sur certaines de vos pages désindexées si cette balise est présente (via le code source par exemple). Si elle est présente, le problème se trouve ici et vous n’avez qu’à la retirer pour que Google réindexe progressivement vos pages.

Si vous utilisez WordPress par exemple, il est possible qu’une mauvaise configuration de ces balises noindex soit à l’origine du problème. Vérifiez via votre back-office que les articles/pages ou autres ne soient pas par défaut en no index.

3. Un problème de qualité

La troisième raison expliquant la désindexation de pages de votre site sur Google est liée à la qualité de ces dernières. Google l’a notamment rappelé il y a peu par la voix de Glenn Gabe, qui indiquait que la désindexation de pages était plus souvent liée à un problème de qualité de ces pages qu’à des problèmes techniques.

On peut distinguer deux types de pages :

Des pages inutiles SEO générées

Il peut s’agir de pages médias, pages de tags ou étiquettes, pages auteur, pages archives, pages panier, ou bien évidemment des pages de catégories de produits (dupliquées, triés selon d’innombrables filtres.)..

Pour de nombreuses raisons, votre site internet peut générer des pages qui n’ont aucun intérêt et qui se retrouvent indexées par Google.

Ces pages, indexées au fur et à mesure par Google (alors qu’elles ne répondent à absolument aucune requête ni aucun besoin de l’internaute), peuvent également être désindexées par le moteur (ou pas). Dans ce cas, une désindexation de ces pages s’avère une bonne chose puisqu’elles ne servent à rien.

D’ailleurs, si vous constatez la présence de ce type de page, vérifiez la configuration technique de votre CMS, tachez de désindexer toutes ces pages inutiles, puis terminez par mettre en place dans votre fichier robots des règles de crawling pour éviter au maximum de gaspiller votre budget crawl et l’apparition de ces pages dans l’index.

Des pages utiles à votre site internet mais mal optimisées

C’est dans ce deuxième cas que vous vous apercevez que des pages que vous avez-vous-même créées se retrouvent désindexées par Google.

Illustrons par un exemple : vous êtes photographe et vous créez des pages afin de mettre en valeur votre travail et vos photos. Vous prenez l’habitude de créer des pages avec seulement quelques photos, mais ne prenez pas le temps de travailler le contenu de ces pages :

  • balises title dupliquées sur vos pages
  • peu/pas de contenu
  • pas de balises alt,
  • pas de titre Hn…
  • Aucun contenu mais du texte dupliqué sur chacune des pages : « voir les tarifs », « me contacter », etc…

Pour Google, vos pages sont quasiment « vides », ne sont pas optimisées et ne répondent donc pas à un quelconque besoin d’un internaute.

Il est alors possible de voir une grande quantité de ces pages, pourtant utiles à vos yeux, désindexées du jour au lendemain par le moteur.

La solution dans ce cas ? Repenser la construction de son site, en ajoutant du contenu utile en plus de vos photos…

4. Une balise canonique ou une redirection prise en compte

Votre site possède des pages dupliquées. Afin d’éviter cette situation vous avec déterminé vos URL canoniques avec l’attribut rel=canonical.

Vous faîtes comprendre à Google quelle URL vous préférez indexer, et l’incitez à choisir la bonne URL. Si vous n’aviez pas fait cela au moment de la mise en ligne de votre page, le moteur avait pu indexer une ou plusieurs versions de votre page (dupliquée).

L’ajout de votre balise canonique a peut-être eu pour effet la désindexation de votre (ou de vos) page(s) de l’index, remplacée par l’URL « officielle ».

De la même façon, vous avez récemment ajouté une redirection (301 par exemple) sur une page, afin de la rediriger vers une autre de manière permanente. Lorsque Google la prend en compte, le moteur de recherche peut remplacer l’ancienne URL par la nouvelle, la rendant invisible de la SERP.

5. Le fichier robots en cause ? Non !

L’ajout de règles dans votre fichier robots.txt va indiquer à Google  quelles pages ou quels répertoires vous ne souhaitez pas qu’il crawle.

Une page déjà indexée ne sera pas désindexée en ajoutant son URL dans le fichier. Cela aura pour effet d’indiquer à Google de ne pas aller la crawler à nouveau. Mais étant déjà connue de sa part et déjà présente dans les SERP (et si elle est pertinente à ses yeux), il n’y a aucune raison qu’elle ne désindexe.

Pour cela vous pouvez soit demander une désindexation manuelle via la Google Search Console, soit la retirer de votre fichier robots et ajouter une balise noindex dans le <head> de la page.

1 Commentaire
  • Classic Cola
    23 janvier 2023 at 20 h 12 min

    Merci pour cet article. Je pensais que ce genre de situation était impossible dans le cas d’une page d’excellente qualité sous tout rapport. Donc, j’ai pensé à une désindexation manuelle dans le cadre d’une opération de nseo (on soudoie un employé véreux de G… si, si, ça existe: j’ai vu des offres comme ça dans le DW). Mais en fait, en resoumettant l’url sur la GSC, j’ai pu constater que la page, désindexée depuis une semaine sans que je m’en rende compte avait été réindexée presque immédiatement. Le paragraphe 1 de l’article atténue ma parano (souvent justifiée). C’est bien. Merci! 😉

Poster un commentaire