Accueil / Projets Wikimedia / Wikipédia / Comment le futur de Google, Caffeine, référence t-il les articles de Wikipédia ?

Comment le futur de Google, Caffeine, référence t-il les articles de Wikipédia ?

Posted on

Ce fut la nouvelle du jour, Google sort un nouveau moteur de recherche répondant au doux nom de Caffeine. Google a annoncé sur son blog que Caffeine n’allait rien révolutionner, que c’était une simple évolution du moteur actuel et qu’il donnerait des résultats de recherche plus pertinents que la version actuelle.

Depuis de nombreuses années, de nombreux Wikipédiens pensent que Google déclasse les articles de Wikipédia pour certains résultats de recherche. Pour l’instant aucune étude sérieuse sur le sujet n’a été menée pour étayer ces affirmations

Avec la sortie de Caffeine, et de ses résultats plus « pertinents », l’idée a refait surface que Google en profiterait pour modifier le référencement des articles de Wikipédia. C’est ce que j’ai voulu savoir en tirant quelques statistiques rapides.

Tout d’abord je suis bien conscient que les quelques requêtes que j’ai faites ne peuvent pas être représentatives de l’ensemble des requêtes possibles, mais les résultats obtenus sont, à mon sens, suffisamment tranchés pour avoir une bonne idée de l’évolution qu’est Caffeine.

Au final c’est donc une soixantaine de requête qui ont été comparées. Le choix des requêtes s’est fait selon plusieurs critères. Une première série de requêtes a été générée en fonction des articles de Wikipédia les plus lus au mois de juillet. Google adaptant ses résultats à l’actualité, il me semblait intéressant de voir l’impact que l’actualité peut avoir sur les résultats de Caffeine.
Deuxième série, des requêtes « bateaux ». Des noms de pays, de villes ou de personnages connus et sans réelle actualité pour le moment, le but cette fois-ci étant l’opposé de celui de la première série : voir les évolutions du référencement sur des requêtes relativement stables. Dernière série, les acronymes. Le but étant de voir comment Caffeine gère les requêtes pouvant avoir plusieurs significations. J’ai également couplé les deux premiers critères aux acronymes et ai soumis des acronymes ayant une actualité (clubs de foot notamment) et d’autres « bateaux ».

Comparatif statistique des résultats des requêtes de recherche de Google et Caffeine
Comparatif statistique des résultats des requêtes de recherche de Google et Caffeine

Comme on peut le voir sur le graphique, les résultats ont peu bougé, et plutôt vers un meilleur référencement des articles Wikipédia, mais rien de transcendant. Vu les évolutions, cela pourrait être mis sur le compte de l’évolution naturelle du référencement des sites. En revanche, il est plus intéressant de constater non pas l’évolution du référencement mais la pertinence des résultats.

Comparatif des résultats Google et Caffeine pour la requête JO
Comparatif des résultats Google et Caffeine pour la requête JO

Pour la requête JO, on voit clairement l’évolution. Tout d’abord Wikipédia ressort bien plus tôt dans les résultats de la recherche, mais au-delà d’un référencement meilleur, c’est surtout l’amélioration de la pertinence qui est remarquable. Alors que sur Google la requête JO nous donne pour résultat les articles “Jo-Wilfried Tsonga” et “Jeux olympiques d’été de 1936” Caffeine nous donne des résultats bien plus pertinents avec “Jeux olympiques” et “Journal officiel de la République française“.

De même que pour les acronymes, par exemple pour TFC et OM, Caffeine propose, en plus des pages dédiées aux acronymes, la signification la plus courante (Toulouse Football Club et Olympique de Marseille).

Au final Caffeine ne modifie que légèrement le référencement des sites et quand elle le modifie, c’est souvent pour des résultats plus pertinents.

Cette « étude », qui n’en est pas une, n’est pertinente que par apport à la Wikipédia francophone, pour des recherches en français et localisées sur la France. Mais c’est un bon départ pour se faire une idée des évolutions de Caffeine.

Si vous tombez sur des requêtes aux résultats intéressants, dans un sens comme dans l’autre, n’hésitez pas à m’en faire part.

Top