| Comprendre le budget des ballonnements de l'indice et la narration est un aspect clé du référencement technique. Cet article décomposera ces concepts pour vous aider à optimiser les performances de votre site. Chez Greenlane, nous nous spécialisons dans le référencement technique et sommes là pour vous aider. Si vous êtes confronté à des défis dans ce domaine, n'hésitez pas à contacter notre équipe. |
Commençons par quelques définitions.
Qu'est-ce que l'index Bloat?
Index Bloat se produit lorsqu'un site Web a des pages excessives et inutiles indexées par les moteurs de recherche. Une page Web inutile est une page qui ne fournit pas de matière à vos objectifs; Ils n'ont pas non plus d'importance pour les chercheurs. Des pages Web en double non gérées ou similaires à chaque autre entre dans la catégorie des ballonnements d'index.
Qu'est-ce que le budget d'exploration?
Le budget de la rampe dans le référencement fait référence au nombre de pages qu'un moteur de recherche est disposé et capable de ramper (ou de découvrir) sur un site Web dans un délai donné. On pense généralement que trois facteurs principaux l'influencent:
- Limite de taux d'exemple – Le nombre maximum de demandes qu'un moteur de recherche fera sur un site sans surcharger le serveur.
- Demande de rampe – Quelle quantité de Google veut ramper un site, en fonction de facteurs tels que la fraîcheur du contenu, l'autorité et la qualité globale du site.
- Qualité du site – La qualité du site joue un rôle crucial dans les décisions de rampage et d'indexation de Google, ainsi que des sites faisant autorité avec un contenu précieux sont rampés plus fréquemment et efficacement.
L'optimisation du budget d'exploration garantit que les moteurs de recherche se concentrent sur l'indexation des pages importantes plutôt que de gaspiller des ressources sur du contenu à faible valeur ou en double.
Prenez Google, par exemple. Il a une bande passante et une mémoire limitées allouées à chaque site Web. Lorsqu'un site est trop indexé, les moteurs de recherche comme Google doivent gaspiller des ressources de traitement et de filtrage des pages non pertinentes ou en double. Cela peut ralentir l'indexation du nouveau contenu et un impact négatif sur les performances de recherche. Le gaspillage des ressources de rampe de Google est indirectement corrélée avec les classements organiques inférieurs.
Il s'agit d'aider les moteurs de recherche avec une découverte de page efficace
Gérer comment les moteurs de recherche découvrent que les pages peuvent être difficiles. Voici des points clés à garder à l'esprit:
- Les moteurs de recherche n'indemblent pas chaque page qu'ils rampent
- Les moteurs de recherche ne craignent pas chaque page qu'ils connaissent à partir des découvertes précédentes
- Les moteurs de recherche (notamment Google) peuvent deviner les pages qui ne sont même pas rampantes
Les # 1 et # 3 ci-dessus représentent une énergie (ou un budget) dépensé pour vos pages Web. C'est de l'énergie dépensée que nous voulons mieux contrôler en tant que SEO.
Notre travail en tant que SEO technique est d'aider les moteurs de recherche à utiliser leurs ressources plus efficacement. De meilleurs classements résultent souvent lorsque les moteurs peuvent facilement identifier lesquels de vos pages sont les plus précieux pour les utilisateurs. Si vous les faites utiliser plus d'énergie ou si vous choisissez de se concentrer sur des pages de moindre qualité, il y a de plus grandes chances qu'ils ne favorisent pas votre site Web global dans les algorithmes de classement.
Les choses ont changé. Au début, Google visait à indexer l'ensemble du Web. Cependant, ils ont depuis déplacé leur réflexion, probablement en raison du coût et de la complexité d'une entreprise aussi massive. Cela signifie que Google est désormais plus sélectif sur les pages indexées. Si vous rencontrez actuellement des problèmes d'indexation, ce changement d'approche est une cause possible.
En d'autres termes, si vous avez précédemment suivi des pratiques de référencement obsolètes qui ont encouragé l'indexation de tout votre contenu et que ces pages ne génèrent pas de trafic organique, ils pourraient empêcher d'autres pages plus précieuses d'être indexées par Google.
Ces jours-ci, il est plus sage d'être stratégique sur ce qui est indexé. Google est plus sélectif sur ce qu'il choisit d'indexer, favorisant les pages avec une valeur claire, des signaux solides et un engagement élevé. Concentrez-vous sur l'obtention de vos pages transactionnelles et informationnelles indexées. N'indemblez pas des tonnes de pages paginées, de traitement des fichiers ou des pages en double. J'ai constaté que les sites axés sur la base de données (comme les nouvelles et le commerce électronique) sont les pires contrevenants concernant Index Bloat.
Bloat d'index de surveillance
La console de recherche est le meilleur endroit pour surveiller votre indexation. Voici un exemple du rapport sur les pages indexé de Greenlane.
Nous avons un site plus petit et 120 pages indexées correspond à mes attentes. Cela représente nos pages de génération de leads (comme les services et les études de cas) et nos pages d'information (comme les articles).

Cependant, cette capture d'écran met en évidence un problème connexe – 669 pages sont sur le radar de Google mais restent non indexés.
Compte tenu de la longue histoire de notre site, de nombreuses pages (y compris les 404, des redirections, des pages liées à l'extérieur et d'autres URL inutiles fabriquées à partir de notre instance WordPress) ne doivent pas être indexées. Google gère correctement ces pages en ne les indexant pas, mais ils consomment toujours des ressources d'exploration inutilement.
Cela signifie que Google a déjà dépensé des ressources à ramper ces pages sans importance, gaspillant efficacement notre budget de rampe. À mon avis, cela est considéré comme un ballonnement. Je dois fournir à Google des signaux plus clairs sur ce qui compte vraiment et les décourager de gaspiller des ressources sur les pages indésirables.
J'ai du référencement à faire. Je ne pourrai pas mettre ce numéro à zéro, mais l'objectif est de vous rapprocher le plus possible.
Comment gérer l'index Bloat
Si nous voulons que Google se concentre uniquement sur les pages importantes, nous devons examiner l'architecture interne de notre site Web. Cela comprend la navigation, les liens internes, les sitemaps XML et les liens à partir de pages Web extérieures.
Architecture du site et liaison interne – Assurer la navigation, les liens internes, les sitemaps XML et les liens externes hiérarchisent les pages importantes sont essentielles. Les liens internes devraient s'écouler vers des pages indexables, renforçant leur importance.
Tags canoniques – Une bonne canonalisation aide à consolider le contenu en double et empêche la rampe inutile de pages redondantes. Cependant, il est important de noter que les étiquettes canoniques sont une suggestion, pas une directive – Google peut encore ramper des pages en double.
Rediriger la gestion – Minimiser les chaînes de redirection et assurer des chemins de clic propre peut améliorer l'efficacité de la rampe. Google suit les redirections, mais la réduction de celles inutiles empêche le budget de la framer gaspillé. Bien que les redirectes uniques soient généralement très bien, les redirectes multiples dans une ligne (chaînes de redirection) des déchets de déchets d'exploration et ralentissent la découverte de la page.
NOINDEX pour les pages indésirables – Une balise NOINDEX META ROBOTS est le meilleur moyen de garder les pages hors de l'index tout en permettant à Google de les ramper. Le code Crawl gaspille-t-il un budget d'exploration? Il y a un débat dans la communauté du référencement sur la question de savoir si Google respecte pleinement les limites du budget de la rampe lors de la rampe de pages nuisibles. Bien que NOINDEX empêche l'indexation, il n'arrête pas toujours de ramper.
Robots.txt pour bloquer les rampes – Si NOINDEX n'est pas possible, un bloc Robots.TXT peut empêcher la rampe mais ne supprime pas les pages déjà indexées. Si une page bloquée par robots.txt se trouve via des liens, il peut toujours être indexé.
Nofollow sur les liens – Bien que Nofollow soit désormais traité comme un indice, il peut encore réduire le rampage inutile. Il est utile lors de la liaison à des pages de faible valeur ou non pertinentes. Le NOFollow interne doit être utilisé stratégiquement – par la suite, il peut empêcher les pages importantes de recevoir des capitaux propres de liens.
Sitemap XML organisé – Un plan du site XML organisé aide les moteurs de recherche à découvrir efficacement et à hiérarchiser les pages importantes, en veillant à ce que le contenu essentiel soit rampé et indexé plus efficacement. Assurez-vous que seules les pages de grande valeur sont incluses dans votre plan du site XML pour guider efficacement les moteurs de recherche.
La gestion du ballonnement de l'indice et l'optimisation du budget de rampe sont essentiels pour garantir que les moteurs de recherche se concentrent sur les pages qui comptent le plus. En affinant l'architecture de votre site, en mettant efficacement les liens internes intelligents et en utilisant des directives comme NOINDEX, ROBOTS.TXT et les balises canoniques, vous pouvez améliorer l'efficacité d'indexation et les performances de recherche. Le référencement est un processus continu et rester proactif avec des optimisations techniques aidera votre site à rester compétitif. Si vous avez besoin de conseils d'experts pour affiner votre efficacité de crawl, Greenlane est là pour vous aider – retirez notre équipe à tout moment.
Les problèmes de compréhension de l'indice de compréhension et du budget de compréhension du SEO sont apparus en premier sur Greenlane Search Marketing.
