mardi 3 mars 2015

Le DARPA et Memex au service des enquêteurs

Dans une interview accordée récemment à CBS, on apprend que le DARPA, l'agence de recherche de l'armée américaine, a développé une nouvelle application pour mieux lutter contre la criminalité, Memex.
Le DARPA dispose d'un département dédié à l'Innovation de l'Information, I2O, dont le but est de développer des programmes informatiques pour mieux lutter contre la criminalité, y compris la cybercriminalité et le terrorisme.
Développé par Chris White, ingénieur au Bureau I2O du DARPA, Memex est l'héritier du fameux projet inventé par le Dr. Vannevar Bush en 1945.


Selon le DARPA, au cours des deux dernières années, 60  millions de pages web à caractère criminel ont été publiées sur le web et le Darknet. Pour un enquêteur, cela représente des "Big Data" qu'il faut pouvoir analyser afin d'extraire l'information pertinente.
Les moteurs de recherche classiques comme Google sont basés sur une fonction d'indexation du contenu des pages web triées par popularité et les internautes interrogent les serveurs au moyen de mots-clés.
Memex exploite la technique inverse de ce concept, dans la mesure où à partir d'une requête, il est capable d'établir des liens entre les données de différentes pages web, y compris entre les sites partageant les mêmes bannières promotionnelles, et surtout de dévoiler des informations cachées dans le réseau Tor du Darknet et les réseaux clandestins peer-to-peer.
Grâce à des outils de data mining, Memex est capable d'analyser ces "Big Data" afin d'y trouver des corrélations, d'identifier des organisations et des personnes. Ces données peuvent ensuite être présentées sous forme graphique afin de s'adapter aux besoins des utilisateurs.
Memex est pour le moment uniquement utilisé par le ministère américain de la Défense. Il a déjà été testé lors du Super Bowl, afin de tracer les réseaux de prostitution.
En effet, à partir des pages du Darknet faisant la promotion de services sexuels par exemple, Memex est capable de géolocaliser les serveurs de ces pages, l'auteur des publicités, son adresse IP, son numéro de téléphone, etc.
En recoupant ces données avec des portraits de femmes figurant sur ces pages, Memex a pu mettre en évidence les mouvements de différentes prostituées et apporter son support au travail de la police qui peut ainsi plus rapidement identifier les trafiquants et venir en aide aux femmes vulnérables.

Exemple d'écran de visualisation des Big Data traitées par le programme Memex du DARPA. Cet outil de data mining permet d'effectuer des requêtes sur des milliards de données afin d'établir des correspondances entre elles. Chaque noeud ou terminaison peut être agrandie et interrogée. Document DARPA/I2O.
Dan Kaufman, directeur de l'I2O du DARPA, précise que Memex préserve la privacité des données et n'a pas pour objectif de récupérer les informations à caractère privé des réseaux sociaux par exemple ni de désanonymiser des données ou des services anonymes. C'est également clairement indiqué dans la page de présentation de Memex.
Notons que dans le cadre de son rapport sur le Big Data, en janvier 2015 le président Obama a salué l'initiative du DARPA et l'aide qu'apportait Memex aux forces de police.
Memex au service des scientifiques et des particuliers
Le périmètre bien précis de Memex sous-entend qu'il n'a pas la même finalité que les programmes de la NSA et qu'il ne serait pas relié à leurs outils ni à leurs bases de données. 
Perte inutile de ressources ou volonté délibérée, à chacun de juger l'intérêt de ces restrictions.
Ceci dit, dans la lutte internationale contre le crime et le terrorisme, il est difficile de croire que Memex ne trouvera pas d'application au sein de la NSA. Ce ne sera pas la dernière invention du DARPA qui sera exploitée par l'agence de renseignement américaine pour ne citer qu'Arpanet et son protocole TCP/IP.

Exemple d'écran de visualisation de données de Memex.
Document DARPA/I2O.
Quand bien même Memex ne viserait que la recherche des criminels, il faut avouer que cette application a coûté entre 10 et 20 millions de dollars. Quand on sait que Facebook ou Google rachète des sociétés de développement pour plusieurs milliards de dollars (par ex. Facebook a racheté WhatsApp pour 19 milliards de dollars en 2014), Memex reste une "petite" application si on la compare à ces budgets extravagants.
Cela ne veut pas dire qu'elle n'est pas puissante ni intelligente, c'est-à-dire capable d'extraire l'information pertinente perdue parmi des milliards de données anodines.
Actuellement Memex vient uniquement en support des enquêteurs de police (trafic d'armes, de drogue, prostitution, terrorisme, etc) mais à terme il pourrait servir les intérêts de la communauté scientifique (par ex. la lutte contre les épidémies d'Ebola) et ceux des particuliers.
Mais n'espérez pas qu'il soit intégré à Google ou Bing. L'intérêt de ces entreprises privées est pécuniaire et elles n'ont aucun intérêt à proposer des pages n'offrant aucun potentiel de revenus publicitaires.
A lire: Deep Web Search' May Help Scientists.

Aucun commentaire :

Enregistrer un commentaire