Traitement du langage naturel et son impact sur la façon dont nous recherchons

Cet article fournit une introduction au traitement du langage naturel et à son fonctionnement, y compris les étapes de tokenisation et de lemmatisation. Il explique également comment Google BERT NLP utilise le mappage d’entités pour l’analyse sémantique, ce qui a modifié la recherche, ainsi que la manière dont vous pouvez utiliser le NLP dans la recherche de mots clés SEO.

Prêt à aligner votre contenu sur la façon dont Google en fait comprend la langue ? Cartographions votre marque aux entités qui comptent le plus. Contactez-nous pour mettre la PNL au service de votre référencement.

Qu’est-ce que le traitement du langage naturel?

Selon IBM, le traitement du langage naturel (ou PNL) est « un sous-domaine de l’informatique et de l’IA qui utilise l’apprentissage automatique pour permettre aux ordinateurs de comprendre et de communiquer avec le langage humain ».

La PNL n’est pas un concept nouveau. On en a beaucoup plus discuté ces derniers temps en raison de l’IA générative, dont nous reviendrons, mais elle inclut également :

  • Traduire du texte dans différentes langues
  • Filtres anti-spam pour le courrier électronique
  • Saisie semi-automatique
  • Chatbots
  • Fonctionnalité de synthèse vocale

Comment fonctionne le traitement du langage naturel ?

PNL supervisée c’est quand le logiciel est formé pour répondre d’une certaine manière. En revanche, PNL non supervisée c’est lorsque le logiciel utilise un modèle de langage pour identifier les modèles dans le texte et renvoyer une réponse. Il y a des étapes pour cela :

  1. La PNL décompose les phrases saisies en mots individuels (tokenisation)
  2. La PNL marque les parties du discours (noms, verbes, adjectifs, etc.) à partir de l’entrée
  3. La PNL simplifie les mots dans leur forme racine (lemmatisation)
  4. La PNL essaie de lever l’ambiguïté des mots ayant des significations différentes
  5. La PNL identifie des entités spéciales – le nom d’un spécifique personne, lieu ou chose
  6. La PNL recherche le sentiment pour déterminer pourquoi tu demandes ce que tu demandes

Au cours des douze dernières années, Google a publié un certain nombre de mises à jour d’algorithmes qui ont conduit à la recherche conversationnelle que nous connaissons aujourd’hui.

Colibri (2013) c’est à ce moment-là que Google a commencé à essayer de cartographier entités. Par exemple, si je recherche « Riven », Google consulte son index pour obtenir des informations supplémentaires sur le jeu.

  • Année de sortie — 1997
  • Disponible sur PC, PlayStation, SEGA Saturn
  • Genre — Aventure pointer-cliquer
  • Avis — 83 sur Metacritic
  • Développeur — Cyan
  • Éditeur — Cyan
  • Jeux connexes — Myst (prequel), Myst III : Exile (suite), Riven (remake 2024)

Voici une illustration de haut niveau de la façon dont Google cartographie les entités liées à Riven.

A LIRE :  Qu'est-ce que le système d'exploitation IA : guide de A à Z pour les débutants !
Carte d’entité PNL pour Riven

Parfois, il vous montre des informations sélectionnées dans le graphique de connaissances.

Boîte de connaissances pour Riven

ClassementBrain (2015) a marqué le moment où Google a commencé à appliquer les données sémantiques et d’entité collectées via Hummingbird pour remodeler activement les résultats de recherche, en utilisant l’apprentissage automatique pour interpréter les requêtes inconnues, affiner la pertinence et mieux correspondre à l’intention de l’utilisateur. Cela a aidé Google à interpréter les requêtes inconnues ou à longue traîne et à mieux comprendre l’intention, en particulier lorsque les correspondances exactes de mots clés n’étaient pas disponibles.

BERTE (2018) est le PNL formel utilisé par Google qui considère la séquence de mots pour dériver une signification plus précise d’une requête. Avant BERT, vous pouviez rechercher une série de mots dans n’importe quel ordre et recevoir des pages Web contenant ces mots (à moins qu’ils n’aient été signalés par des filtres anti-spam). Si vous avez l’habitude de chercher de cette façon – et c’est le cas de toute une génération de personnes – il existe de nombreuses situations dans lesquelles vous devrez prendre le temps de formuler une bonne question. C’est un inconvénient.

Parlons d’un exemple. Royce da 5’9″ a déjà rappé « faire un joint ou deux avec Joyner Lucas » sur une chanson. La phrase était coincée dans ma tête, mais je ne me souvenais pas du titre de la chanson. Avant BERT, si je recherchais « royce joint ou deux avec Joyner Lucas », cela renverrait des sites Web de paroles. Maintenant, il recherche activement un sens dans la ligne. Il renvoie un aperçu de l’IA indiquant que Royce et Joyner n’ont jamais collaboré sur une chanson. Il renvoie des articles d’actualité sur les interactions que les artistes ont eues.

La PNL a influencé les résultats de recherche Google

Google a trouvé un sens à ma requête alors que je voulais juste qu’il me dise quelle chanson avait la réplique. Maintenant, je dois soit :

  1. Reformulez ma requête : [royce da 5’9” lyrics joint or two with Joyner Lucas]ou
  2. Recherche avec des guillemets : [royce “joint or two with joyner lucas”]

Dans les deux cas, Google a pu comprendre ma véritable intention et j’ai appris que la chanson s’appelait « Combat ».

Résultats de recherche Google après avoir envisagé la PNL

Google devrait proposer une option de recherche classique aux personnes habituées à utiliser sa fonction de recherche de manière traditionnelle, mais je m’éloigne du sujet.

Optimisation PNL Stratégies

Que se passe-t-il? Google essaie de trouver un sens plus profond à chaque requête, ce qui signifie que les stratégies de référencement doivent changer. Il est important d’examiner attentivement la manière dont Google perçoit chaque phrase clé, les entités qu’il extraira et ce que font les sites Web de classement pour gagner leur position.

A LIRE :  Qu'est-ce que Parasite SEO : guide de A à Z pour les débutants !

Sur les SERP :

  • Regardez ce qu’est le classement pour déterminer l’intention de recherche (blogs, produits, un mélange ?)
  • Recherchez un Knowledge Graph – rappelez-vous que Google classe ces points de données comme entités, et nous souhaitons les utiliser via un schéma, des liens pertinents ou des références sur la page

Sur les pages classées, pensez à :

  • Comment ces pages sont-elles organisées ?
  • Quelles questions sont posées et comment les réponses sont-elles formatées ?
  • Ces réponses sont-elles extraites de People Also Ask ?
  • Dans quelle mesure leur optimisation de mots clés est-elle agressive ?

De plus, étant donné que la PNL décompose les phrases en parties du discours et simplifie les mots jusqu’à leur racine, les phrases simples peuvent être plus faciles à traiter (du moins pour le moment).

Plus un logiciel en sait sur vous, plus son PNL peut être utile. Pour en revenir au Déchiré Dans l’exemple précédent, j’ai demandé à Google et ChatGPT : « Comment battre Riven ? Ce que je voulais dire : le jeu d’aventure pointer-cliquer de 1997. Ce qu’ils pensaient que je voulais dire, c’était un personnage ennemi dans Ligue des Légendes.

Google

Google NLP répond à la mauvaise question

ChatGPT

ChatGPT répond à la mauvaise question

Le but de la PNL est de comprendre le langage humain et de générer des réponses semblables à celles des humains. Le but est pas donner un correct réponse. Cependant, si les entreprises souhaitent que nous utilisions leurs logiciels, il faut que ce soit correct le plus souvent possible. Alors, comment une PNL peut-elle être droite s’il ne comprend pas la question ? En apprenant à vous connaître.

Regardez ce qui se passe lorsque je dis à ChatGPT « Cette conversation concerne le jeu de 1997, Riven. » J’ai d’abord posé quelques questions, puis je suis revenu à ma question initiale : « comment battre Riven ?

Autoriser le traitement du langage naturel dans ChatGPT

— Plusieurs questions plus tard —

Discutez sur GPT en répondant à la bonne question

Même requête de 4 mots, mais maintenant avec une réponse complètement différente.

Je prédis que l’avenir de la PNL sera un effort pour sauter cette première étape, non pas en lisant dans vos pensées, mais en intégrant tout ce qu’elle peut trouver sur vous. VOUS serez transformé en une entité. Pour y parvenir, la nécessité de collecter vos données et de synchroniser tous vos appareils va s’aggraver. C’est à vous de décider si l’efficacité vaudra le caractère invasif.

Un partenaire pour l’optimisation de la PNL: Si vous avez besoin d’aide pour déterminer la place de votre marque dans la cartographie des entités de Google ou si vous avez besoin d’aide pour optimiser votre contenu pour la recherche NLP, contactez-nous pour en savoir plus sur nos services de référencement.