Améliorez le référencement en audit et en fixant des étiquettes canoniques (et comment le faire)

L'étiquette canonique a été introduite en février 2009 par Google, Yahoo et Microsoft (Bing) pour relever un défi de référencement important: Contenu en double dans les sites Web et dans différents domaines.

Au début des années 2000, alors que Google solidifiait sa domination, de nombreux webmasters (comme on l'appelait alors) ont découvert qu'ils pouvaient améliorer leur classement simplement en copiant le contenu de quelqu'un d'autre et en le republiant sur leurs propres sites Web. Sans surprise, les créateurs de contenu originaux n'étaient pas satisfaits de perdre du trafic et de la visibilité qui leur appartenaient à juste titre.

À peu près à la même époque, les sites Web devenaient de plus en plus dynamiques. Les pages Web n'étaient plus codées manuellement de haut en bas; Au lieu de cela, ils ont été générés à partir des entrées de base de données. Ce changement a créé un défi pour les grands sites, en particulier les plates-formes de commerce électronique, où un seul produit pourrait générer plusieurs URL uniques basées sur des variations telles que la taille, la couleur ou le prix. En conséquence, les moteurs de recherche ont géré des milliards de pages redondantes, ce qui rend plus difficile de fournir des résultats de recherche précis.

Dans une rare démonstration de collaboration, les trois principaux moteurs de recherche – Google, Yahoo et Microsoft (Bing) – ont jugé des forces pour relever le défi croissant de gérer un nombre écrasant de pages Web. Ensemble, ils ont introduit le étiquette canonique comme solution.

J'imagine que leur conversation se déroule comme ceci:

«Et si nous créions une balise que les webmasters pouvaient placer sur une page Web pour l'identifier comme la version principale? Cela pourrait nous aider à éviter d'indexer des variations moins importantes et de nous concentrer sur les pages qui comptent réellement. »

Et donc, l'étiquette canonique est née. Et c'était super. En tant que personne qui a travaillé sur des sites de commerce électronique à Million-Url, cette étiquette simple est devenue un changement de jeu. Cela m'a permis de guider les moteurs de recherche vers les pages qui comptaient vraiment, en coupant l'encombrement des variations sans fin. Les moteurs de recherche, à leur tour, étaient ravis. Ils n'avaient plus à perdre du temps à ramper et à indexer des pages inutiles, ce qui leur a sans aucun doute économisé une fortune dans les ressources du serveur et l'électricité.

A LIRE :  Comment postuler pour Shark Tank India: un guide étape par étape!

Vivre dans le section of your webpage, the canonical tag’s purpose is to signal to search engines which version of a page is the “main” one — the version you want to be indexed and ranked as the original or authoritative document.

It’s important to note that the tag “suggests” rather than directs search engines. Google and Bing treat the canonical tag as a hint, not an absolute rule. This distinction is critical because search engines don’t always follow the suggestion. Search engines sometimes choose to ignore the tag, either mistakenly or because they interpret the content differently.

These miscalculations by search engines are precisely why SEOs need to understand, monitor, and validate canonical tag implementations to ensure the right pages are indexed and ranking as intended.

Here’s more on the canonical tag definition: https://googlewebmastercentral.blogspot.com/2009/02/specify-your-canonical.html

   

How To Audit Your Canonical Tags

You’ll need a crawler like Screaming Frog or Sitebulb.  

Step 1: Crawl your entire site. In this example, I’m crawling Guitar Center. Give yourself a full site crawl to get the big picture (to mimic Google). Under configurations, I typically respect noindex, but force through rel=”nofollows”.

I also don’t choose to respect canonicals because I want to capture all the duplicate content.

Export the canonical report, and you’ll get a lot of data:

Exportation canonique

Step 2: Let’s compare column A to column B, and see where the mismatches are.  The magic formula to paste into column C is:

=IF(A4=B4,"Equal","Not Equal")

Ensuite, triez pour afficher uniquement «pas égal». Vous obtiendrez quelque chose comme ça. Ceux-ci doivent être réparés:

égal ou pas égal

Examinons le premier résultat. La feuille de calcul nous indique cette page: https://www.guitarcenter.com/jbl-eon500-series-g5076t1.gc A une balise canonique pour cette page: https://www.guitarcenter.com/search/default.aspx?pcid=5076.

Donc, en d'autres termes, la page Web indique à Google de ne pas indexer cette page:

A LIRE :  Questions à poser lors de l'embauche d'une agence de référencement

Page 1

Mais la balise canonique dit qu'ils devraient plutôt indexer cette page, une erreur apparente et une mauvaise mise en œuvre de la balise canonique (Hey Guitar Center, appelez-nous!):

Page 2

Il serait problématique que Google décide de suivre la balise canonique dans ce cas. Pour vérifier cela, j'ai vérifié si https://www.guitarcenter.com/jbl-eon500-series-g5076t1.gc a été indexé – et ce n'était pas le cas. À moins qu'il n'y ait un problème plus important que je ne connais pas, cela semble être un cas d'une implémentation de balise canonique imparfaite.

Comme mentionné tout au long de cet article, Google se réserve le droit d'ignorer votre balise canonique lorsqu'ils croient qu'il est dans le meilleur intérêt des utilisateurs de recherche. Cependant, il existe des scénarios spécifiques où Google est plus susceptible de ne pas tenir compte de votre balise. Ceux-ci incluent:

  • Canonicalisation à la mauvaise URL. (Cela a été mentionné.)
  • URL canonique brisée. (Si le code est faux, Google n'est pas très indulgent.)
  • Boucle canonique. (Si les balises canoniques envoient Google dans une boucle, ils ne tiendront pas compte de la balise.)

Tag canonique vs 301 Redirection

Une astuce rapide et pertinente: je conseille toujours aux clients d'utiliser 301 redirections au lieu de compter uniquement sur les balises canoniques. Bien que Google affirme que les balises canoniques passent la même quantité de PageRank qu'une redirection 301, je pense que les redirectes sont la solution de référencement plus fiable et préférée. Les balises canoniques fonctionnent le mieux comme réseaux de sécurité pour les sites Web où la mise en œuvre des redirections est difficile, mais lorsqu'il est donné le choix, une redirection 301 est toujours le mouvement plus sûr.

L'identification des valeurs aberrantes canoniques est relativement facile si vous savez quoi rechercher. Si vous avez des questions ou si vous souhaitez plonger plus profondément dans les meilleures pratiques de balise canonique, n'hésitez pas à nous contacter.

Vous aimez le référencement technique? Vous pouvez également aimer: