Améliorer le référencement en auditant et en corrigeant les tags canoniques (et comment le faire)

Temps de lecture: 5 minutes

  1. Explorez votre site Web avec Screaming Frog pour obtenir des données sur toutes les URL de votre site Web. Laissez le robot explorer toutes les pages que vous avez ouvertes aux moteurs de recherche. (Détails)
  2. Une fois cela fait, exportez-le via l'onglet «directives» et filtrez «canonique». Cliquez sur "exporter".
  3. Avec Excel, vous pouvez ajouter = IF (A4 = B4, «Égal», «Non égal») dans une colonne pour identifier rapidement les balises canoniques correctement implémentées. (Détails)

Vous aimez le référencement technique? Tu pourrais aussi aimer:

La balise canonique peut être une bénédiction ou une malédiction. Vivre dans le section de votre page Web, son but est de suggérer aux moteurs de recherche la page canonique appropriée. La page “canonique” est la page d'origine, ou la page que vous voulez représenter votre document "principal".

Notez ci-dessus que j’ai dit «suggérer aux moteurs de recherche». C’est parce que Google et Bing ne prendront pas cette balise comme une directive; ils considéreront plutôt cela comme un indice. C’est un concept très important, car nous constatons souvent que Google ne suit pas l’allusion (et devrait l’avoir), et inversement. Cette erreur de calcul de Google explique pourquoi les référenceurs ont besoin de comprendre et de surveiller les implémentations de balises canoniques.

Voici plus sur la définition de balise canonique: http://googlewebmastercentral.blogspot.com/2009/02/specify-your-canonical.html.

Alors, quel est le problème?

(Si vous connaissez déjà le fonctionnement des balises canoniques, vous pouvez ignorer cette section.)

La raison pour laquelle Google n'accepte pas la balise canonique en tant que directive est probablement due au fait qu'ils savent que de nombreux webmasters peuvent facilement la bousiller (syntaxe, implémentation, etc.). Si vous possédez un site de commerce électronique basé sur une base de données volumineuse et que vous avez essayé de faire implémenter des balises canoniques par une équipe de développeurs, vous avez compris comment il peut être lancé avec une tonne de résultats inattendus. Les meilleures intentions ne correspondent pas toujours à une mise en œuvre appropriée.

Exemples que j’ai vus: Grâce aux modèles, les produits ont été soudainement «canonisés» sur la page d’accueil. Ou alors, la page 4 d'une collection se canonise soudainement à la page 1 de la collection. Ou dupliquez le contenu s'auto-canonisant à la place de l'URL appropriée.

Des résultats fantastiques et aléatoires sont toujours probables s’ils ne sont pas mis en œuvre et correctement vérifiés. Plus le site est grand, plus le processus d'assurance qualité est difficile. Lorsque la balise a été annoncée en février 2009, j'ai travaillé pour l'une des plus grandes plateformes de commerce électronique de l'époque. Nous voulions être les premiers à proposer cela, et nous nous sommes précipités – avec beaucoup, beaucoup de problèmes. J'ai toujours eu une relation amour / haine avec ce tag.

De plus, au début, il semblait presque que Google prenne son temps pour répondre au tag. Les journaux indiquent les visites encore et encore, mais les balises ne prennent jamais. Puis, lors d'une visite aléatoire, boum! Comme si Google "cliquait" simplement sur ce que nous essayions de leur montrer.

C’est moins le cas aujourd’hui, mais c’est toujours le cas. La patience est un must. Mais ce qui est le plus frustrant, c’est parfois que Google n’honore pas du tout l’étiquette canonique, même lorsque cela a tout son sens de le faire. Je travaille actuellement sur un site avec 1,5 million d’URL indexées. Un tiers seulement des pages sont de véritables URL canoniques. Il y a donc beaucoup de doublons de contenu (donc, index bloat et crawl gaspillage). La balise canonique est activée correctement, mais Google ne l’a pas encore acceptée. Cela fait 6 mois. Dans la sagesse algorithmique infinie de Google, il semble que nous devions en faire plus pour que cela les influence.

La ligne du bas: la balise canonique est loin d'être parfaite. C’est cette imperfection que vous, en tant que SEO, souhaitez planifier.

Comment auditer vos tags canoniques

Vous allez avoir besoin de deux choses: Screaming Frog (si vous avez un site volumineux, la version gratuite ne le coupera pas) et un tableur.

Étape 1: Explorer tout votre site avec Grenouille qui hurle. Donnez-vous un crawl ouvert pour que vous puissiez avoir une vue d'ensemble (pour imiter Google). Sous Configuration> Spider, je respecte généralement noindex, mais force SF via rel = "nofollows". Je ne respecte pas non plus les lois canoniques parce que je veux capturer tout le contenu en double.

Une fois cela fait, exportez-le via l'onglet «directives» et filtrez «canonique». Cliquez sur exporter.

Vous obtiendrez un nouveau fichier Excel brillant qui, après le nettoyage, ressemblera à ceci: (cliquez pour agrandir l'image):

Exportation canonique

Étape 2: Comparons la colonne A à la colonne B et voyons où se trouvent les disparités. La formule magique à coller dans la colonne C est la suivante:

= IF (A4 = B4, "égal", "différent")

Ensuite, triez pour afficher uniquement «Pas égal». Vous obtiendrez quelque chose comme ça (cliquez pour agrandir l'image):

égal ou pas égal

Voyons le premier résultat. Le tableur nous dit cette page: http://www.guitarcenter.com/JBL-EON500-Series-g5076t1.gc a une balise canonique pour cette page: http://www.guitarcenter.com/Search/Default.aspx?pcid=5076.

En d'autres termes, la page Web indique à Google de ne pas indexer cette page:

Page 1

Mais ils devraient plutôt indexer cette page:

Page 2

Si Google décide de suivre cette balise canonique, ce serait une mauvaise chose. J'ai donc vérifié si http://www.guitarcenter.com/JBL-EON500-Series-g5076t1.gc était indexé. Ce n'est pas. Dans ce cas (à moins d’une raison plus importante pour laquelle je ne suis pas au courant), il s’agit d’une implémentation défectueuse de balises canoniques.

Raisons pour lesquelles Google ignore le tag Canonical

Tout au long de cet article, j’ai parlé du fait que Google se réservait le droit d’ignorer votre balise canonique quand ils jugeraient préférable de le faire. Mais, il y a des raisons spécifiques pour lesquelles ils ignoreront votre tag. Tel que:

  • Canoniser dans la mauvaise URL. (Cela a été mentionné.)
  • URL canonique cassée. (Si le code est incorrect, Google ne pardonne pas beaucoup.)
  • Boucle canonique. (Si les balises canoniques envoient Google en boucle, elles ne seront pas prises en compte.)

Tag canonique vs redirection 301

Un commentaire rapide et pertinent: j'exhorte toujours les clients à effectuer des redirections 301 au lieu d'espérer que la balise canonique fonctionne. Google dit qu'ils traitent les balises canoniques comme une redirection 301, en ce sens qu'elles transmettent la même quantité de PageRank. Les balises canoniques sont des solutions par défaut raisonnables – ou des filets de sécurité – pour un site Web sur lequel il est difficile de coder, mais à mon avis, étant donné l'option, une redirection 301 est toujours la méthode de référencement préférée.

Il s'agit d'un processus relativement facile à repérer les points aberrants Si vous avez des questions ou souhaitez en savoir plus sur les pratiques optimales en matière de balises canoniques, faites-le moi savoir dans les commentaires!