Comment fonctionne la recherche Google ?

Des algorithmes aux réponses affichées pour les utilisateurs, comment est-ce que la recherche fonctionne ? Quelles sont les étapes parcourues par les moteurs de recherche ?

Il y a 3 grands chapitres dans l’encyclopédie de la recherche Google :

1- Le parcours des données et l’indexation

La recherche commence par le web. Ce dernier est constitué de 130 billions de pages individuelles. Ce chiffre astronomique ne fait qu’évoluer.

Google navigue le web en parcourant les données. Cela signifie que le moteur de recherche suit les liens de page en page. Ces dernières sont classées en fonction de leur contenu et d’autres facteurs de positionnement.

Google garde toutes les données dans son index.

2- Les algorithmes

Google écrit des programmes et des formules pour délivrer les meilleurs résultats possibles.

Lorsque l’utilisateur effectue une recherche, les algorithmes travaillent et cherchent des indices pour comprendre au mieux ce que souhaite l’utilisateur. Les indices passent par l’épellation des mots, l’auto remplissage, les synonymes, la compréhension de la requête, les méthodes de recherche, l’affichage de résultats en temps réel…

En fonction des indices reçus, Google affiche des documents pertinents depuis son index. Les résultats sont classés, basés sur près de 200 facteurs (la qualité du site et de la page, la fraicheur du contenu, la sécurité, le contexte de l’utilisateur, la traduction, la recherche universelle…).

Google détient un laboratoire de recherche dans lequel des changements sont testés et opérés par les ingénieurs du Géant mondial.

Les résultats prennent des formes différentes : extraits enrichis (snippets), actus, graphiques, annonces textuelles, images, vidéos… Tout cela en 1/8eme de seconde.

3- La lutte anti-spam

Google combat le spam 24h/24, 7 jours sur 7, afin que les résultats affichés soient fiables. La suppression des spams est quasiment toute automatisée. Quelques documents sont encore vérifiés à la main. Si un spam est détecté, des actions manuelles sont engagées.

Les types de spams régulièrement combattus sont :

– des liens pas naturels depuis un site
– des liens pas naturels vers un site
– des sites piratés
– des sites affichant des contenus différents aux utilisateurs et aux moteurs de recherche
– des hébergeurs gratuits qui détiennent beaucoup de contenu polluant
– des contenus courts avec peu ou pas de valeur ajoutée
– des domaines séparés
– des contenus spammés rédigés par des utilisateurs
– des textes ou des mots clés cachés

Lorsque des actions sont engagées, le propriétaire du site est notifié. Il peut alors corriger son site et demander un nouvel examen.

Voilà comment fonctionne la recherche. Derrière de simples pages de résultats se trouve un système complexe qui supporte plus de 100 milliards de recherches par mois.






Source : Google – inside search – how search works – the story