(suite et fin)

INDECT est un amalgame de barbouzes, de policiers et d’universitaires. On y retrouve l’Université de Science et Technologie d’AGH, Pologne; l’Université de Technologie de Gdansk; InnoTech DATA GmbH & Co, Allemagne; IP Grenoble Ensimag, France; MSWiA, l’Etat-Major général de la Police attaché près du ministère polonais de l’Intérieur; Moviquity, Espagne; Products and Systems of Information Technology (PSI), Allemagne; le service de Police d’Irlance du nord (PSNI), Royaume-Uni; l’Université de Technologie de Poznan; l’Universidad Carlos III de Madrid; l’Université Technique de Sofie, Bulgarie; l’Université de Wuppertal, Allemagne; l’University of York, Grande-Bretagne; l’Université Technique d’Ostrava, Tchéquie; l’Université Technique de Kosice, Slovaquie; X-Art Pro Division G.m.b.H, Autriche; et la Fachhochschule Technikum, également en Autriche.

Un service de sécurité proactif ou un service de marketing tamisent des montagnes de données disponibles dans les bases de données commerciales, les appels mobiles, tweets, posts de blog, des recherches Internet pour identifier des ‘agitateurs-clés’. Un système de surveillance comme un INDECT est construit pourrait énormément faciliter – et simplifier aux Etats-Unis la déjà formidable ‘Main Core‘ la base de données qui rassemble et stocke – sans garanties ni décisions judiciaires – les noms et les données détaillées des Américains considérés pour être des menaces à la sécurité nationale.

L’échelle ‘d’agencements d’ensembles de données/annotation’ exploité par INDECT est impressionnant. Cela comprend l’extraction automatique de contenus glanés dans une large gamme de sources, comme des infos, qui identifie des relations entre des entités et les événements dans lesquels elles participent. La Knowledge Base Population (KBP) est un agencement d’annotations qui se concentre sur l’identification des types d’entité de Personne (PAR), d’Organisation (ORG) et d’Entité Géopolitique (GPE), d’Emplacement (LOC), d’installations (FAC), de Véhicule (VEH) et d’Arme (WEA). Tout cela est réalisé par l’exploitation de sources ouvertes.

Un article de Wikipedia est utilisé comme base de connaissance originale. La collecte de documents consiste en un million d’articles newswire. La base de connaissance de référence inclut des centaines de milliers d’entités basées sur des articles Wikipedia. L’agencement d’annotation dans KBP se concentre sur l’identification des types d’entité de Personne (PAR), l’Organisation (ORG) et l’Entité Géopolitique (GPE). Rien n’échappe à cet oeil universel. INDECT cite la société de location de film Netflix comme modèle: les 100 millions d’évaluations des 480.000 clients Netflix sont jugés ‘bien adaptés‘ au modèle de surveillance INDECT.

Des architectes de surveillance de l’Union européenne proposent une nouvelle annotation et un nouvel agencement de représentation des connaissances qui serait extensible, qui permet le complément de nouvelles entités, de relations et d’événements, toute en évitant les doubles-emplois et en assurant l’intégrité. Le déploiement d’une méthodologie ontologique qui exploite des données actuellement disponibles de la source ouverte (des nouvelles, des émissions, des entrées de blogs, des résultats de recherche, des liens obtenus par une lecture d’écoutes téléphoniques de portables, des achats de carte de crédit, des dossiers médicaux, des itinéraires de voyage, etc.) INDECT annonce que, dans un proche avenir, sa recherche permettra un moteur de recherche capable d’aller au-delà des questions de mot-clé simples en exploitant les informations sémantiques et les relations dans l’ontologie.