Francia, España e Italia crearán un sistema inteligente que entenderá frases de textos y audio
14/02/07 14:53:23
Mercè Molist
Que un ordenador localice palabras en un documento es un juego de niños. Pero que entienda el significado de una frase en un correo electrónico o una conversación telefónica es un reto. El Ministerio de Defensa español, junto con Italia y Francia, trabaja en ello desde el proyecto «Infraestructura de Inteligencia Semántica Operacional» (OSEMINTI), que acaba de ponerse en marcha.
El proyecto OSEMINTI debe lograr, según fuentes del Ministerio, que «los servicios de Inteligencia, por medio de ordenadores, puedan identificar frases con significados concretos en cintas de grabación o en texto escrito y, a su vez, que dichos ordenadores aprendan, con el conocimiento que van generando en su interacción con las personas».
Francia lidera el proyecto, que durará dos años. España contribuye con 1.856.000 euros, el 30% del presupuesto. Según el Ministerio, «el campo natural de OSEMINTI es la Inteligencia militar», aunque también otros «ámbitos de defensa y seguridad, tanto civil como militar».
Por su capacidad de entender el significado de un texto interceptado, OSEMINTI es un paso más en la evolución de los sistemas de espionaje telemático, cuyo representante más popular en el campo civil fue Carnivore, usado durante años por el Federal Bureau of Investigation (FBI) para monitorizar comunicaciones en Internet.
Carnivore, según la Wikipedia, se instalaba en el proveedor de acceso (ISP) de la persona a espiar, previa orden judicial, y era capaz de discriminar la interceptación de sólo los datos autorizados por el juez, que copiaba al vuelo y mandaba a un ordenador central.
Su existencia se conoció en el año 2000, por una disputa legal con un ISP que se negaba a instalarlo, y provocó las protestas de grupos de libertades civiles de todo el mundo. Se hizo tan popular que hubo quien realizó obras de arte basadas en Carnivore, rebautizado después por el FBI como DCS-1000.
Carnivore era la tercera generación de los sistemas de espionaje de redes del FBI. El primero fue Etherpeek, actualmente un programa comercial. El segundo, Omnivore, usado entre 1997 y 1999 y sustituído por DragonWare, que constaba de tres partes: Carnivore, que capturaba la información; Packeteer, que convertía los paquetes interceptados en textos coherentes, y Coolminer, que los analizaba.
El sistema provocó muchas controversias por sus fallos, como espiar a la persona equivocada, y porque en ocasiones se usó sin permiso judicial, según los grupos de libertades civiles. La ley «USA Patriot» acabó con la discusión, al decretar que el FBI podía monitorizar redes sin orden de un juez ni sospechas fundadas, mientras sólo captase la información del tráfico y no su contenido.
A partir de entonces, se habló cada vez menos de Carnivore. Por una parte, los ISP monitorizaban ellos mismos sus redes y mandaban los datos al gobierno. Y por otra parte, floreció el mercado de sistemas comerciales más evolucionados, que sustituyeron a Carnivore en las investigaciones del FBI.
Un ejemplo de estos programas comerciales es el Analizador Semántico de Tráfico de la empresa Narus, supuestamente usado por la Agencia Nacional de Seguridad (NSA). Se instala en diferentes puntos de una red y puede examinar cantidades ingentes de tráfico en tiempo real, identificando los paquetes interesantes, procedentes de correos, mensajería instantánea, vídeos o telefonía por IP, aunque viajen a más de 10 Gbps.
El Ministerio de Defensa no afirma ni desmiente que esté trabajando en un «Carnivore» europeo: «Será el usuario quien determine el posible uso de la tecnología una vez que se obtengan resultados desarrollados y maduros». En realidad, OSEMINTI no es un Carnivore sino un paso más.
El problema actualmente no es recopilar la información, ni técnica ni legalmente: los operadores europeos tienen la obligación de guardar los datos de tráfico de Internet y telefonía hasta dos años, así como de obedecer las órdenes judiciales de interceptación del contenido de llamadas o comunicación por Internet.
El problema es, precisamente, procesar esta cantidad cada vez más diversa e ingente de datos, procedentes de múltiples fuentes, sobre todo cuando no son datos de tráfico, fácilmente procesables, sino contenidos que deben ser leídos y entendidos. Una tarea que, explica Defensa, «ahora mismo realizan personas, que son las que tienen el conocimiento para poder identificar frases con un significado concreto».
Para que OSEMINTI asuma esta tarea primero hay que poder transformar la información interceptada, mediante herramientas de conversión rápida, a un espacio semántico que entiendan las máquinas y demostrar que, explica el Ministerio, «mediante el uso de un lenguaje común entre los datos, información, algoritmos y personas, se mejora la interoperabilidad de diferentes fuentes de información o sistemas de sensores clásicos».
Esto permitirá «diseñar y desplegar sistemas inteligentes, que tengan conocimiento y capacidad de aprender, para la gestión de situaciones complejas en tiempos adecuados». Lo que llevará al objetivo final: «Sistemas que se transforman debido a la integración de conocimiento procedente de la misión y las personas participantes». Así, el objetivo parece ser no sólo entender la información sino unificar la procedente de diversas fuentes, aunque Defensa no aclara si el proceso se hará «al vuelo», captando los datos en tiempo real, o una vez interceptados.
«ESTO VA A SER UN BOMBAZO»
«No acabará con el terrorismo, porque los métodos tradicionales siempre son mejores, pero ayudará», explica Arturo Quirantes, profesor de la Universidad de Granada y estudioso del espionaje gubernamental, refiriéndose a OSEMINTI: «Es un tipo de reconocimiento semántico, es decir, no sólo de palabras sino de ideas, para que conversaciones del tipo»esto va a ser un bombazo«se puedan clasificar y saber si se trata o no de un proyecto de atentado».
Para Quirantes, OSEMINTI es un claro avance respecto a las tradicionales listas de palabras que se dan a un ordenador, para que las localice en una comunicación. Pero asegura: «Tiene sus limitaciones porque los terroristas no son tontos y pueden usar un lenguaje convenido, por ejemplo decir que»las camisas ya están planchadas«para referirse a mochilas-bomba».
Además, explica el experto, la eficacia y disponibilidad de estos sistemas conlleva problemas de privacidad porque «se está pasando de monitorizar a algunos individuos a hacerlo indiscriminadamente». Lo que, a su vez, complica el trabajo policial: «Con tantas comunicaciones, identificar la conversación clave no es sencillo, aumenta enormemente la información no relevante y los gastos para ponerlo en orden».
Desde el punto de vista militar, dice: «Occidente sigue empeñado en librar la misma guerra electrónica que tan bien le sirvió en la II Guerra Mundial, cuando la interceptación y el descifrado masivo de las comunicaciones alemanas hizo maravillas». Pero entonces las comunicaciones eran pocas, frente al volumen de la actualidad: «Ya no hay un enemigo grande y fácil de identificar, ni el esfuerzo de interceptación y descifrado es secreto, lo que permite a un enemigo tomar contramedidas».
Acuerdo para una Infraestructura de Inteligencia Semántica Operacional
Inteligencia Semántica Operacional
Carnivore Replaced with Commercial App
Copyright 2007 Mercè Molist.
Verbatim copying, translation and distribution of this entire article is permitted in any digital and no commercial medium, provided this notice is preserved.
Extraído de http://ww2.grn.es/merce/2007/defensa.html
Info en INSUMISSIA sobre Militarismo y Control social:
Los artistas descubren los fallos de la videovigilancia
Nuevas tecnologías de la comunicación y control social (Francisco Sierra)
Reino Unido: ¿adiós a la privacidad?
Videovigilancia en la Sociedad Panóptica Contemporánea (Jacob Bañuelos)