Rechercher

Les secrets des moteurs de recherche

Le moteur de recherche est, bien devant la navigation, le point  d’entrée principal pour trouver ce qu’un utilisateur recherche sur un site web. 

En France, 74% des internautes effectuent des recherches directement à partir de la barre de recherche d’un site lorsqu’ils se connectent à partir d’un ordinateur et 67% à partir d’un terminal mobile.*

*Enquête Sensefuel 2019 sur 1271 utilisateurs

Un moteur de recherche, c’est quoi et comment ça marche? 

Un moteur de recherche est une application web permettant à un utilisateur d’effectuer une recherche en ligne, c’est-à-dire de trouver des ressources à partir d’une requête composée de termes. Les ressources peuvent notamment être des pages web, des articles de forums, des images, des vidéos, des fichiers, des ouvrages, des sites pédagogiques, des applications ou des logiciels open source.

Le fonctionnement d’un moteur de recherche se décompose en trois processus principaux :

L’exploration ou crawl : L’activité de crawling d’un moteur de recherche désigne le processus par lequel un moteur va explorer les différents contenus rencontrés sur Internet, sur un site web ou sur une application en particulier.

Pour un site web ou une application, le fait que ses contenus soient « crawlés » est le préalable à une indexation et à une visibilité plus ou moins favorable dans les résultats des moteurs de recherche.

L’indexation est le processus qui consiste à extraire les mots ou les ressources qui ont été préalablement enregistrés dans une base de données. Chaque terme aura un “poids” qui permettra d’ajuster la priorité et la pertinence des résultats de recherche. L’indexation s’effectue après un ensemble de traitements syntaxiques et sémantiques souvent basés aujourd’hui sur l’intelligence artificielle. 

La recherche correspond à la partie “requêtes” du moteur qui restitue les résultats. Un algorithme est appliqué pour identifier les documents qui correspondent le mieux au recherche par ordre de pertinence supposée.

Les 5 enjeux des moteurs de recherche ?

Enjeu #1: le moteur de recherche doit être à la bonne place

Le moteur de recherche doit être facilement identifiable, situé sur  toutes les pages du site et, si possible, embarquer un pictogramme loupe.

Enjeu #2: le moteur de recherche doit comprendre le langage naturel

L’utilisateur tape sa recherche de la même manière qu’il le ferait à l’oral en posant la question à un ami. 

Enjeu #3: le moteur de recherche doit être intelligent

Le mécanisme d’auto-suggestion aide les utilisateurs à trouver une requête appropriée en essayant de la prédire en fonction des caractères saisis. Il n’améliore pas la vitesse de navigation mais il fonctionnera de guide. 

Enjeu #4: le moteur de recherche doit être rapide

Le searchanding est un outil qui accroît énormément les moteurs de recherche. Lorsque le client commence sa recherche sur le moteur, le site internet doit être capable de lui proposer des résultats le plus rapidement possible. 

Enjeu #5: le moteur de recherche doit savoir personnaliser

Garder les recherches récentes et/ou donner la possibilité de sauvegarder une recherche pour éviter de tout saisir à nouveau. Proposer des résultats déjà cherchés ou en lien avec l’expérience de navigation précédente. 

Exemples et cas d’usage à propos des moteurs de recherche ?

Certains sites web offrent un moteur de recherche comme principale fonctionnalité. Ce sont des instruments de recherche sur le web sans intervention humaine. Ils sont basés sur des robots encore appelés “bots”, “spiders”, “crawlers” ou “agents” qui parcourent automatiquement les sites à intervalles réguliers afin de découvrir de nouvelles URLs. Par exemple: Googlebot est le user agent du crawler de Google; BingBot est celui de Bing et AppleBot celui d’ Apple etc… La liste des différents moteurs de recherche sont en note de bas de page. 

Aussi, les solutions de recherche en mode SaaS (Ex: Algolia, CloudSearch, Google Custom Search, Microsoft Azure Search, etc..) sont souvent utilisées pour les sites e-commerce ou les places de marché (tels que amazon.com). Ces solutions permettent de s’appuyer sur des documents et des index qu’on lui a définis. Ces solutions sont très appréciées par les développeurs car elles intègrent des librairies existantes et documentées. 

Pour aller plus loin ?

Nous voyons de plus en plus de débats autour de l’éco-responsabilité et du respect de la vie privée. Savais-tu qu’à chaque requête soumise à un moteur de recherche s’ensuit un échange de données qui entraîne des émissions de CO2 ? Données qui peuvent être personnelles et que certains sites peuvent collecter afin de mieux connaître les habitudes des utilisateurs (cookies, stockage d’adresses IPs etc…) et de pousser des publicités au bon moment…

Un peu de lecture ?

Google bot: https://fr.wikipedia.org/wiki/Googlebot 
User agent: https://fr.wikipedia.org/wiki/User_agent 
Les moteurs de recherche: https://fr.wikipedia.org/wiki/Liste_de_moteurs_de_recherche 

Photo by Agence Olloweb on Unsplash

Logo Discord

Envie de converser en mode Cozy Web avec toute la rédac’room et la formidable communauté bienveillante de plus de 500 personnes qui ont rejoint #BonjourPPC Le Digital pour tous ?
On vous accueille ici avec grand plaisir.

vignette podcast bonjourPPC

Tu cours après le temps ?
Si ça te dit de te joindre à nous et recevoir la newsletter hebdo te permettant d’apprendre plein de choses et de ne pas rater le train du digital, il te suffit de t’inscrire ici

Proposé par
Sara Bianchi

Product Owner @OctoTechnology part of Accenture.
Convaincue que le premier rôle du Product Owner est de fédérer et coordonner une équipe pluridisciplinaire autour d’une même vision.

#coconstruction #agile #humain

Joindre la discussion

A lire dans cette thématique

illustration des lettres LSF effectué par main de robot style Terminator

La LSF et le digital

La LSF est la langue des signes française. Une langue à part entière reconnue en France en 2005. La LSF et le digital, c'est tout...

La Playlist du DJ

La newsletter