Le FN vainqueur des régionales selon Google
Dans une précédente brève, l’Agitateur avait soulevé les problèmes de fiabilité posés par les résultats fournis par Google.
Cela se confirme avec l’apparition d’un site qui arrive systématiquement en haut de la première page de résultats de Google à la requête « Régionales 2010 » : region2010.fr

Ce site ne donne aucune information sur les futures élections. Ce n’est qu’un site de sondage en ligne. Et comme tous les sondages en ligne, il n’a aucune validité puisqu’il ne respecte aucune des règles des sondages d’opinion. Pas de quoi en faire un fromage, donc.
Sauf que ce sondage sur l’évolution des intentions de vote en France donne le FN en tête, et largement en tête !

Bien évidemment, les résultats ne sont que le fait d’internautes sympathisants du FN qui ont massivement investi ce site pour participer au sondage.
Mais pourquoi ce site sans intérêt est-il systématiquement proposé par Google quand vous recherchez des informations sur les élections régionales ? C’est à cause de la technique utilisée par Google pour classer ses résultats. Bien que jalousement gardé, l’algorithme (méthode de calcul) de classement utilisé par le moteur de recherche est principalement basé sur deux notions : la popularité et la richesse du site.
La popularité est une notion assez simple : elle est basée sur le nombre de sites sur le web qui font un lien vers le site en question. Si beaucoup de sites font un lien, c’est que ce site doit être intéressant. Google appelle ça le Page Rank. Pourtant, ce site n’a qu’un Page Rank de 3 sur une échelle de 10 (seul google.com a d’ailleurs un Page Rank de 10, c’est dire l’honnêteté de la pratique ;-). A titre de comparaison, le site de la Ville de Bourges, site qui ne concerne pas grand monde ailleurs qu’à Bourges, a un Page Rank de 6. On estime - Google est évidemment muet sur le sujet - qu’il y a un ratio de 10 entre chaque niveau. On peut donc considérer que le site region2010.fr est 1000 fois moins « populaire » sur le web que le site de la Ville de Bourges ! Pas de quoi le mettre en première page des résultats.
C’est là qu’intervient la « richesse » du site. En gros, Google privilégie dans ses résultats les sites à fort contenu par rapport à ceux qui ont un faible contenu. Se pose alors la question de savoir comment Google mesure la « richesse » du contenu d’un site. Bien évidemment, ce ne sont pas les employés de Google qui analysent manuellement tous les sites et leur donnent une note ! C’est beaucoup plus simple : pour Google, plus il y a de pages différentes dans un site, plus il est « riche ». Le webmaster du site region2010.fr a donc utilisé à fond cette faille : il a fait autant de pages qu’il y a de communes en France ! Ce site a donc plus de 36000 pages (37493 exactement). Pour Google, ça ne fait aucun doute, si ce site a autant de pages, il est forcément intéressant, et il faut le mettre en première page des résultats.
Voilà comment un site annonçant la victoire du FN se retrouve comme le meilleur site pour Google quand on fait une recherche sur les élections régionales en 2010. En France, 90% des recherches sur le web se font par Google.