TNto se puede decir que no estuviéramos avisados. Allá por 1999, cuando faltaban cinco años aún para que Mark Zuckerberg enredara socialmente al mundo en Facebook y ocho para que Steve Jobs empezara a inundar los cinco continentes de iPhones y torrentes de aplicaciones, Scott McNealy, entonces consejero delegado del gigante tecnológico Sun Microsystems, pronunció un comentario definitivo: "Tienes cero privacidad. Asúmelo".

Ya por entonces la frase levantó ampollas. McNealy la dijo justo cuando su empresa estaba presentando una tecnología diseñada para compartir información entre aparatos, horas después de que su rival Intel se viera forzado a modificar unos chips capaces de obtener datos de los usuarios y cuando un gerifalte del Departamento de Comercio de EEUU estaba en Europa precisamente intentando convencer a los gobiernos de que las empresas estadounidenses estaban comprometidas con la seguridad y la privacidad...

Han pasado casi tres lustros desde entonces, tiempo en el que se ha producido una transformación radical no solo tecnológica, también en la recolección, explotación, almacenamiento y comercialización de datos, tanto en el sector privado como en el público, como han demostrado las escandalosas revelaciones de Edward Snowden sobre los invasivos programas de vigilancia y espionaje del Gobierno de EEUU.

Es lo que Joe Hellerstein, científico informático de la Universidad de California en Berkeley, ha llamado "la revolución industrial de los datos". Hasta la cosa aparentemente más mundana o insignificante es como petróleo, oro negro en la economía de la información. A las empresas, a los anunciantes, a sus intermediarios, a los científicos, a los investigadores, a los partidos políticos que buscan votos y a los gobiernos les importa todo: tu sexo, tu edad, tu localización, tus hábitos de consumo, tus intereses, tu vida social... Tienen valor asuntos que antes no se veían como información. Y todas esas revelaciones sobre uno mismo no hace falta compartirlas públicamente en sitios como Facebook, donde se cuelgan 10 millones de fotos cada hora. Son fáciles de obtener.

La industria Big Data

La información que tantos buscan y que otros tantos querrían proteger está a una compra de distancia, a una llamada de teléfono, a un clic, a un tecleo de una búsqueda en un navegador (solo en Google hay 3.000 millones al día, y el gigante guarda el rastro de todas). Y se prodigan como un virus centenares de empresas especializadas en capturar esos datos, almacenarlos y minarlos para comerciar con ellos, a menudo sin que el observado sea consciente de que le están siguiendo o sin que pueda hacer mucho para evitarlo.

Una ambiciosa investigación sobre privacidad y este llamado Big Data (el sector que recoge y trafica a gran escala con los datos) del diario Wall Street Journal (que desde hace tres años tiene en marcha una inquietante serie titulada Lo que saben ) desveló que, por ejemplo, ya en el 2010, 50 de los sitios más visitados de la web instalaban de media 64 piezas que permiten seguir al usuario, como cookies , flash cookies o los llamados beacon (aún más sofisticados que las primeras, ya que logran capturar lo que se teclea). Doce de esos sitios tenían más de 100 dispositivos de seguimiento. Y no avisaban de ello.

Son a menudo sitios que ofrecen un servicio gratis (aunque, como recuerda la cita que abre la página de Collusion, un servicio de Firefox para visualizar y bloquear a quienes te espían en la red, "si no pagas por algo no eres el cliente, eres el producto que se está vendiendo"). Y a menudo son también webs que cogen y comparten más información de la que dicen, saltándose la barrera supuestamente sacrosanta de la Información Personal de Identificación, que nadie confiesa vulnerar.

Pero lo hacen. Un estudio publicado en el 2011 por Craig Willis, profesor del Instituto Politécnico de Worcester, reveló que el 56% de 100 sitios web que había analizado filtraban información privada. Y en la investigación del Journal, una de las revelaciones es que más de una cuarta parte de las webs (sobre una muestra de 70) compartían con terceras compañías el nombre auténtico, la dirección de email y otros detalles.

En un caso concreto, el de una página para buscar relaciones on line, se facilitaba a siete compañías el sexo, la edad y el código postal del usuario; se daba información sobre uso de drogas a seis más y detalles sobre la orientación sexual a otras dos.

No solo internet es un manantial vital para estas empresas que subastan la información en los llamados data exchanges. En EEUU, por ejemplo, la ley hace que desde hace años un 95% los teléfonos sean localizables aun cuando no se está realizando ninguna llamada. Y un estudio reciente de la revista Nature demostró que solo cuatro datos sobre localización y hora de llamada permiten identificar a una persona en el 95% de las veces (con solo dos de esos datos se identifica al 50%). MasterCard, por ejemplo, tiene capacidad para agregar y analizar 65.000 millones de transacciones de 1.500 millones de clientes de sus tarjetas en 20 países y puede vender información a otros. Según el Journal, los datos de un estadounidense medio son recogidos en más de 20 formas diferentes en sus actividades diarias.

Es un escenario de intrusión que solo puede aumentar conforme se abaratan los costes de almacenamiento de las ingentes cantidades de datos y se van haciendo más potentes las herramientas para recopilarlos y analizarlos (una industria tecnológica que crece más del 30% al año y que se espera que generará 23.000 millones de dólares para el 2016).

Big Data crece a ritmo vertiginoso, mucho más rápido que las regulaciones que deberían controlar esta nueva era. Y, al hacerlo, minimiza la capacidad de escapar del individuo, que va viendo cómo pierden efectividad herramientas que hasta ahora han reforzado la privacidad, como la posibilidad de optar por ser excluido de servicios de seguimiento o los esfuerzos por preservar el anonimato.

"Con suficientes datos, el anonimato perfecto es imposible por más que uno lo intente", ha alertado Paul Ohm, profesor de derecho en la Universidad de Colorado en Boulder, hablando del ocaso de un proceso en el que hasta ahora tanto las webs como los anunciantes usaban fórmulas que convertían las direcciones de sus usuarios y clientes en series de números y letras que eran enviados a una tercera compañía que buscaba coincidencias sin haber tenido acceso al correo electrónico real.

No todo es negativo. La recolección de datos y el desarrollo de algoritmos cada vez más sofisticados y eficientes para buscar patrones de comportamiento y tendencias permitió a Google, por ejemplo, identificar con más eficacia que el Centro de Control y Prevención de Enfermedades de EEUU la evolución de una epidemia de gripe, y sin acceder a datos médicos.

Expertos como Kenneth Cukier, director de datos en The Economist y coautor del libro recientemente publicado Big Data , están convencidos de que,

de momento, no están pasando demasiadas cosas malas. La meta ahora es ofrecer mejor publicidad personalizada. No estamos en el invierno nuclear de la privacidad o en el Gran Hermano" (aunque vivamos momentos paradójicos, como que, como mostró una investigación británica en el 2007, haya 30 cámaras de vigilancia a menos de 300 metros del apartamento donde George Orwell escribió 1984).

El llamamiento a la calma de Cukier no debe llevar a engaño. Su libro y su conversación están salpicados de ejemplos problemáticos y muy reales de invasión de la privacidad y de sus consecuencias. Y Cukier alerta de que "el problema son los usos potenciales que se pueda dar" a es gran cantidad de datos.

Cita algunas prácticas que hizo la banca durante la crisis financiera. Si alguien que nunca había comprado en Walmart empezaba a ir al gigante de las grandes superficies y de precios baratos de EEUU, el sistema le identificaba como una persona que pasaba apuros financieros, sin tener en cuenta que podía haberse mudado a un sitio donde Walmart era la tienda más cercana o cualquier otra circunstancia. Acto seguido, a ese cliente se le veía como alguien con más riesgo y se bajaba el límite de su tarjeta de crédito. "Está claro que los algoritmos no son perfectos y en ese caso, por ejemplo, penalizaron a gente que igual no lo merecía", constata.

Dictadura de los datos

Lo que late también detrás de lo que este y otros expertos identifican como una potencial "dictadura de los datos" es una inquietante consideración ética: que el peligro no sea solo la pérdida de la privacidad, sino la inclusión en un mundo de probabilidades y estadística con escaso espacio para el libre albedrío.

Si recopilando y aplicando algoritmos a los datos se predice la posibilidad de que a uno le dé un ataque al corazón, por ejemplo, es de esperar que el seguro médico le cobre una póliza más alta. Si esos sistemas predicen que alguien, probablemente, no podrá pagar una cuota de la hipoteca, es más que posible que la banca le niegue un préstamo.

Ya un informe de la NBC aseguró que la CIA asesina con drones "basándose en patrones de comportamiento pero sin una identificación clara". Y la ciencia-ficción de la película Minority report, donde el Departamento de Precrimen hacía arrestos antes de que se cometiera un delito que se predecía, ya no queda tan lejos: la policía usa hoy datos para elaborar perfiles que señalan potenciales sospechosos.

Información para los nazis

Según relata Cukier, hay compañías eléctricas en Europa y EEUU que tienen instalados medidores inteligentes que recopilan datos casi constantemente, en intervalos de quizá solo seis segundos. Esas mediciones tienen información personalizada, y no son iguales las señales que envía el uso eléctrico de un ordenador o un electrodoméstico que las de, por ejemplo, unas lámparas para cultivar marihuana. El potencial está claro.

La dictadura de los datos no es nueva. Como se recuerda en Big Data , en 1943 el censo de EEUU dio al Gobierno información sobre dónde vivían estadounidenses-japoneses, que fueron internados en campos de concentración (para simular que se respetaba la privacidad, solo se facilitó información sobre la manzana donde residían). Los extensos registros civiles que mantenían los holandeses fueron utilizados por los nazis para perseguir a los judíos. Los tabuladores de IBM con los que los nazis hicieron el censo alemán permitieron cercar a la población judía y llevar al día los registros de población de los campos de concentración.

Cuando este mes se reveló la existencia del programa Prism de espionaje de la red desde Washington, Aaron Levie, fundador de Box.com, tuiteó que la Agencia Nacional de Seguridad se había adelantado a varias start ups consiguiendo colocar juntos todos los datos acumulados en Skype, Facebook, Gmail... Era una broma, pero Levie luego habló en serio. "Lo más importante de lo que está pasando es la transparencia, la falta de visibilidad sobre cómo se están usando nuestros datos. El Gobierno y la industria de la tecnología necesitan unirse claramente para crear un mejor modelo".