À ses débuts, il fut souvent reproché à Wikipédia d’être rédigée par et pour des amateurs d’informatique. De ce fait, une représentation excessive des sujets techniques était généralement dénoncée comme un biais inadmissible.
D’intéressantes études statistiques, menées par des chercheurs de l’université Carnegie Mellon et du centre de recherche Xerox de Palo Alto permettent aujourd’hui de se faire une idée objective de la couverture thématique de la Wikipédia anglophone en janvier 2008.
Leur méthode s’appuie sur les catégories, ajoutées par les contributeurs : en cherchant le plus court chemin depuis un article jusqu’à l’une des catégories de plus haut niveau, il est possible de comptabiliser combien d’articles y sont rattachés.
La répartition montre une nette prédominance des articles culturels. Les pourcentages suivants sont ceux de janvier 2008, entre parenthèses est donné leur évolution depuis juillet 2006. Il faut également noter que pendant ces deux années, le nombre de pages et de catégories a plus que doublé :
- Culture et arts : 30% (+210%)
- Biographies et personnes : 15% (+97%)
- Géographie et lieux : 14% (+52%)
- Société et sciences sociales : 12% (+83%)
- Histoire et évènements : 11% (+143%)
- Sciences naturelles et physiques : 9% (+213%)
- Technologie et sciences appliquées : 4% (-6%)
- Religions et systèmes de croyances : 2% (+38%)
- Santé : 2% (+42%)
- Mathématiques et logique : 1% (+146%)
- Philosophie et pensée : 1% (+160%)
Wikipédia est donc l’encyclopédie de la culture et des arts avant tout. Les auteurs mettent en garde contre une interprétation trop rapide de la baisse de la proportion des articles en sciences appliquées.
La même étude s’est également intéressée aux sujets provoquant le plus de conflits, proportionnellement à leur représentation dans l’encyclopédie. Les proportions sont alors toutes différentes :
- Culture et arts : 2%
- Biographies et personnes : 14%
- Géographie et lieux : 2%
- Société et sciences sociales : 7%
- Histoire et évènements : 6%
- Sciences naturelles et physiques: 7%
- Technologie et sciences appliquées : 1%
- Religions et systèmes de croyances : 28%
- Santé : 0%
- Mathématiques et logique : 1%
- Philosophie et pensée : 28%
L’étude de l’équipe d’A. Kittur montre également qu’il est illusoire de chercher à considérer Wikipédia comme un ensemble d’articles homogène, les caractéristiques thématiques variant grandement.
Wikipédia est donc avant tout l’encyclopédie de la culture !
Sources
-
Aniket Kittur, Ed H. Chi, and Bongwon Suh, What’s in Wikipedia?: Mapping Topics and Conflict using Socially Annotated Category Structure. In Proceedings of the 27th international Conference on Human Factors in Computing Systems (Boston, MA, USA, April 04 – 09, 2009). CHI ’09. ACM, New York, NY.
-
Aniket Kittur, Bongwon Suh, Bryan A. Pendleton, Ed H. Chi, He Says, She Says: Conflict and Coordination in Wikipedia. In Proceedings of the 25th international Conference on Human Factors in Computing Systems (San Jose, CA, USA, April 28 – May 3, 2007), CHI’07. ACM, New York, NY.