Améliorez le référencement en vérifiant et en corrigeant les balises canoniques (et comment le faire)

  1. Analysez votre site Web avec Screaming Frog pour obtenir des données sur toutes les URL de votre site Web. Laissez le robot découvrir toutes les pages ouvertes aux moteurs de recherche. (Détails)
  2. Une fois cela fait, exportez via l’onglet «directives» et filtrez «canonique». Cliquez sur «exporter».
  3. Avec Excel, vous pouvez ajouter = IF (A4 = B4, « Égal », « Non égal ») dans une colonne pour identifier rapidement les balises canoniques correctement implémentées. (Détails)

Vous aimez le SEO technique? Tu pourrais aussi aimer:

La balise canonique peut être une bénédiction ou une malédiction. Vivre dans le section de votre page Web, son but est de suggérer aux moteurs de recherche la page canonique appropriée. La page «canonique» est la page d’origineou la page que vous souhaitez représenter votre document «principal».

Remarquez ci-dessus que j’ai dit: «suggérez aux moteurs de recherche». C’est parce que Google et Bing ne prendront pas cette balise comme une directive – à la place, ils la considéreront comme un indice. C’est un concept très important, comme nous le voyons à plusieurs reprises où Google ne suit pas (et devrait avoir) l’indice, et vice-versa. Ces erreurs de calcul de Google expliquent pourquoi les référenceurs doivent comprendre et surveiller les implémentations de balises canoniques.

En savoir plus sur la définition de balise canonique: http://googlewebmastercentral.blogspot.com/2009/02/specify-your-canonical.html.

Alors, quelle est la grosse affaire?

(Si vous savez déjà comment fonctionnent les balises canoniques, vous pouvez ignorer cette section.)

La raison pour laquelle Google n’accepte pas la balise canonique comme directive est probablement parce qu’ils savent que de nombreux webmasters peuvent facilement la bousiller (par exemple, syntaxe, implémentation, etc.). Si vous avez un énorme site de commerce électronique basé sur une base de données et que vous avez essayé de faire en sorte qu’une équipe de développeurs implémente des balises canoniques, vous avez vu comment il peut finalement se lancer avec une tonne de résultats inattendus. Les meilleures intentions ne sont pas toujours égales à une mise en œuvre correcte.

Exemples que j’ai vus: grâce aux modèles, les produits étaient soudainement «canonisés» sur la page d’accueil. Ou, la page 4 d’une collection est soudainement canonisée en page 1 de la collection. Ou, dupliquez le contenu en s’auto-canonisant au lieu de l’URL appropriée.

Des résultats fous et aléatoires sont toujours probables s’ils ne sont pas mis en œuvre et que le contrôle qualité est correctement effectué. Plus le site est grand, plus le processus d’AQ est difficile. Lorsque le tag a été annoncé en février 2009, j’ai travaillé pour l’une des plus grandes plateformes de commerce électronique de l’époque. Nous voulions être les premiers à offrir cela, et nous l’avons précipité – avec beaucoup, beaucoup de problèmes. J’ai toujours eu une relation amour / haine avec ce tag.

Joignez-vous à notre liste d’envoi!

Vous voulez savoir quand de nouveaux outils gratuits et des articles de blog seront publiés? Rejoignez notre newsletter!

De plus, au début, il semblait presque que Google prenait son temps pour répondre à la balise. Les journaux afficheraient les visites encore et encore, mais les balises ne prendraient jamais. Puis lors d’une visite aléatoire, boum! Comme si Google venait de «cliquer» sur ce que nous essayions de leur montrer.

Cela semble être moins un cas aujourd’hui, mais c’est toujours répandu. La patience est un must. Mais la chose la plus frustrante – parfois, Google n’honore pas du tout le tag canonique, même quand cela a tout le sens du monde de le faire. Je travaille actuellement sur un site avec 1,5 million d’URL indexées. Seul un tiers des pages sont de véritables URL canoniques, il y a donc beaucoup de contenu en double (donc, des ballonnements d’index et des déchets d’exploration). Le tag canonique est correctement activé, mais Google ne l’a tout simplement pas encore accepté. Cela fait 6 mois. Dans la sagesse infinie algorithmique de Google, il semble que nous devons faire plus pour que cela les influence.

Conclusion: la balise canonique est loin d’être parfaite. C’est cette imperfection que vous, en tant que SEO, souhaitez planifier.

Comment auditer vos balises canoniques

Vous allez avoir besoin de deux choses: Screaming Frog (si vous avez un grand site, la version gratuite ne le coupera pas) et une feuille de calcul.

Étape 1: Explorez l’ensemble de votre site avec Grenouille hurlante. Donnez-vous une exploration grande ouverte afin d’avoir une vue d’ensemble (pour imiter Google). Sous configuration> Spider, je respecte généralement noindex, mais force SF à rel = « nofollows ». Je ne respecte pas non plus les canoniques car je veux capturer tout le contenu en double.

Une fois cela fait, exportez via l’onglet «directives» et filtrez «canonique». Cliquez sur exporter.

Vous obtiendrez un nouveau fichier Excel brillant qui, après le nettoyage, ressemblera à ceci (cliquez pour agrandir l’image):

Exportation canonique

Étape 2: Comparons la colonne A à la colonne B et voyons où se trouvent les décalages. La formule magique à coller dans la colonne C est:

=IF(A4=B4,"Equal","Not Equal")

Ensuite, triez pour afficher uniquement «Non égal». Vous obtiendrez quelque chose comme ça (cliquez pour agrandir l’image):

égal ou différent

Examinons le premier résultat. La feuille de calcul nous indique cette page: http://www.guitarcenter.com/JBL-EON500-Series-g5076t1.gc a une balise canonique pour cette page: http://www.guitarcenter.com/Search/Default.aspx?pcid=5076.

En d’autres termes, la page Web indique à Google de ne pas indexer cette page:

Page 1

Mais ils devraient plutôt indexer cette page:

Page 2

Si Google décide de suivre cette balise canonique, ce serait mauvais. J’ai donc vérifié si http://www.guitarcenter.com/JBL-EON500-Series-g5076t1.gc était indexé. Ce n’est pas. Dans ce cas (à moins qu’il n’y ait une raison plus importante pour laquelle je ne suis pas au courant), il s’agit d’un cas d’implémentation de balise canonique défectueuse.

Raisons pour lesquelles Google va ignorer le tag canonique

Tout au long de cet article, j’ai évoqué le fait que Google se réserve le droit d’ignorer votre balise canonique lorsqu’elle le juge préférable. Mais, il existe des raisons spécifiques pour lesquelles ils ignoreront votre balise. Tel que:

Étiquette canonique vs redirection 301

Un commentaire rapide et pertinent: j’exhorte toujours les clients à faire des redirections 301 au lieu d’espérer que la balise canonique fonctionne. Google dit qu’ils traitent les balises canoniques comme une redirection 301, en ce sens qu’elle transmet la même quantité de PageRank. Les balises canoniques sont des solutions par défaut raisonnables – ou des filets de sécurité – pour un site Web difficile à coder, mais à mon avis, étant donné l’option, une redirection 301 est toujours la méthode de référencement préférée.

Il s’agit d’un processus relativement simple pour repérer les valeurs aberrantes. Si vous avez des questions ou souhaitez en savoir plus sur les meilleures pratiques en matière de balises canoniques, faites-le moi savoir sur Twitter!