samedi 18 août 2007

Un scanner identifie ceux qui éditent Wikipédia

Wikipédia est actuellement la plus grande encyclopédie libre, que chacun peut améliorer, disponible sur Internet. Elle comprend plus de 5.4 millions d'articles dont 7% sont rédigés en mandarin, 10% en français, 12% en allemand et 36% en anglais parmi une dizaines de langues utilisées.
Mais nous devons pondérer ces valeurs car beaucoup d'articles rédigés en français par exemple ne sont que des traductions plus ou moins complètes et parfaites de la version anglo-saxonne qui contient de ce fait les articles les plus détaillés.
Mais tout participant à Wikipédia a un jour constaté que l'article qu'il avait rédigé avait été modifié, corrigé, complété voire de temps en temps censuré, c'est-à-dire que des paragraphes entiers avaient disparu sans motif.
Or la politique de Wikipédia est bien claire, supprimer une information publique est un acte de vandalisme qui ne peut être justifié sous aucun prétexte. L'information est donc immédiatement restaurée.
Si l'auteur continue d'agir de la sorte, son compte sera bloqué ou les modérateurs l'empêcheront à l'avenir d'éditer Wikipédia sur base de son adresse IP.
A l'inverse, il est légitime qu'une personne citée nommément où dont on met la vie privée sur la toile exige que son nom et ses données soit supprimées. Mais même à ce titre, il n'est pas toujours facile de faire entendre raison aux jeunes modérateurs de Wikipédia qui s'accordent parfois des privilèges abusifs d'administrateurs. En général, il faut régler ces litiges avec un responsable national. Dans tous les cas, en Europe, la loi sur le respect de la vie privée protège l'individu, et plus sévèrement qu'aux Etats-Unis. Wikipédia ne déroge pas à la règle. Mais il y a des cas où Wikipédia est surpris par la réaction de certains participants.
Ainsi, le 17 novembre 2005, un éditeur anonyme a supprimé 15 paragraphes d'un article consacré à une machine de vote électronique vendue par Diebold, article dans lequel le rédacteur critiquait les machines de la société.
Bien qu'anonyme, de tels changements laissent des empreintes numériques comme la localisation de l'ordinateur utilisé sur base de son adresse IP. Dans ce cas, les changements avaient été effectués des bureaux même de la société Diebold. Et cet exemple est loin d'être un cas isolé.
Mais un nouveau système de "data-mining" (d'exploitation de données) a été lancé cette semaine pour tracer les millions d'entrées effectuées sur Wikipédia et les recouper avec l'adresse IP de leur éditeur, et pour la première fois, chacun peut identifier les personnes ou les organisations suspectées de manipuler les données.
Le scanner de WikipédiaInspiré par un fait d'actualité remontant à 2006 où des membres du Congrès américains avaient modifié leurs propres entrées, Virgil Griffith, un jeune chercheur grec actuellement au Caltech, a voulu savoir si les grandes compagnies et les agences nationales notamment, effectuaient des corrections similaires dans les articles de la version anglo-saxonne de Wikipédia.
Virgil Griffith de Caltech, créateur du scanner de Wikipédia en 2007. Document Jake Applebaum.Wikipédia permet aux utilisateurs de télécharger toute l'encyclopédie, y compris les enregistrements de tous les changements. Griffith a donc téléchargé l'entièreté de Wikipédia, isolant les enregistrements XML ayant été encodés anonymement ainsi que l'adresse IP de l'utilisateur. Ensuite, grâce au service lookup qui permet d'établir une correspondance entre l'adresse IP et le fournisseur d'accès à Internet (FAI) ou le nom du serveur, il a pu corréler ces adresses IP avec le nom de domaine (et avec le pays et la ville où est installé le FAI ou le serveur), ainsi qu'avec les domaines privés en utilisant IP2Location. Griffith a ainsi pu identifier les sociétés et les individus concernés.
Le résultat est une base de 34.4 millions d'articles corrigés par 2.6 millions d'organisations ou individus allant de la CIA à Microsoft en passant par les membres du Congrès que l'on a pu identifier à partir de leur adresse IP.
Aujourd'hui le scanner permet à tout utilisateur d'interroger la base de données à partir du nom d'une organisation, du nom d'un utilisateur, du titre d'un article ou encore d'un choix d'adresse IP (par exemple 193.110.130.100-150).
Etant donné que Wikipédia conserve une trace de toutes les modifications, le résultat reprend la liste des articles modifiés, le nom de l'organisation ou de l'utilisateur qui a effectué la correction et, dans chaque article, les parties qui ont été modifiées (avant/après), une option qui existe déjà dans Wikipédia.
Si on considère l'exemple de la société Diebold, on découvre que quelqu'un dans cette société a supprimé de longs paragraphes détaillant des détails relatifs au secret industriel et l'intégrité de leurs machines de vote, ainsi que des données concernant le directeur de la société et son financement de la campagne du Président Bush.
Le texte, supprimé en novembre 2005 a rapidement été restauré par un autre participant de Wikipédia qui avertit l'éditeur anonyme, "Svp arrêter de supprimer le contenu de Wikipédia. C'est considéré comme du vandalisme". Un porte-parole de la société Diebold a dit qu'il s'occuperait du cas mais n'a pas fait plus de commentaire.
C'est ainsi qu'en utilisant ce scanner, on découvre qu'à partir des bureaux de l'OTAN par exemple, des utilisateurs corrigent des articles d'astronomie ou sur la théorie de la relativité, loin du travail qu'ils sont censés effectuer durant la journée. Ailleurs, on découvre que l'Eglise de Scientologie a été plusieurs fois victime de vandalisme, que des membres du Caltech ont édité plus de 7000 articles, y compris à propos de la vie conjugale de Michael Jackson, ou que le Vatican est également actif sur Wikipédia.
Quelles sont les autres sociétés qui participent à Wikipedia ou qui censurent leurs articles ? Vous souhaitez identifier les agences et les individus qui réécrivent l'histoire ? Essayez vous-même le scanner Wikipédia de Virgil Griffith, vous serez parfois surpris. Rien ne vous empêche ensuite de publier vos découvertes.

Aucun commentaire :

Enregistrer un commentaire