Selecciona Edición
Entra en EL PAÍS
Conéctate ¿No estás registrado? Crea tu cuenta Suscríbete

Cuatro casos en los que el 'big data' pasó de útil a escalofriante

Cuando las empresas aprenden a utilizar los datos de sus clientes pueden llegar, por ejemplo, a predecir un embarazo adolescente

Un guardia de seguridad observa las pantallas de una sala de control. Getty Images

Pese al misterio que rodea al término de moda, lo que nos referimos al decir big data es solo a una herramienta informática, extremadamente potente, que compila enormes cantidades de datos, imposibles de escrutar por la mente de un ser humano, y, con suerte, permite sacar alguna conclusión de la comparación de datos. Como el mundo no para de crear bytes en volúmenes cada vez mayores, toda esa información podría ser un tesoro estadístico para estudiar desde hábitos de compra hasta tendencias médicas como previsión temprana de suicidios. Big data es, pues, como lo define empresa IBM  “una tendencia tecnológica para entender y tomar decisiones […] aplicable a toda aquella información improcesable por procesos o herramientas tradicionales”. 

Esa es la cara bonita. La cruda realidad es que esos bytes contienen información cada vez más y más íntima y al estudiarla con cerebros tan potentes como los artificiales, se puede aprender quizá demasiado sobre una sola persona. Especialmente tajante sobre esto es la Enciclopedia Británica, en su entrada sobre este tema: “La posible invasión de intimidad, a través de los resultados de esta compilación de datos, preocupa a bastante gente, ya que las bases de datos comerciales contienen registros detallados de historiales médicos, transacciones económicas o del uso de los teléfonos”. Vaya por delante que cualquier herramienta tecnológica, no es ni buena ni mala, sino que su valor consiste en hacer predicciones estadísticas que permiten tomar mejores decisiones. Pero hay veces que esta técnica se pasa de la raya.

Una vez adivinó que una adolescente estaba embarazada antes que la propia adolescente

Fue a principios de la década del 2010. En Minneapolis, Estados Unidos, un padre entró airado en una tienda Target, exigiendo ver al responsable del establecimiento. “Mi hija ha recibido esto en el correo”, dijo esgrimiendo un sobre de publicidad con ropa premamá, muebles para habitaciones de bebé y fotos de niños sonrientes. “¿Ella todavía va al instituto y le mandáis descuentos para ropa de bebé? ¿Tratáis de animarla a quedarse embarazada?”, exclamó el progenitor. Según cuenta Charles Duhigg en un reportaje en The New York Times, el encargado, sin saber donde meterse, pidió disculpas al progenitor.

Un científico creó un algoritmo que estudiaba la ingente cantidad de datos que las tiendas almacenan sobre sus clientes, y observó que las mujeres que esperaban un bebé en secreto compraban crema sin perfume

Cuando a los pocos días llamó al hombre para volver a pedir perdón, fue este quien comenzó a disculparse: “He hablado con mi hija y resulta que ha habido ciertas actividades en mi casa. Sale de cuentas en agosto. Le debo una disculpa”. Andrew Pole, un científico de datos, fue quien creó el algoritmo que detectó el embarazo adolescente. Con la cantidad de datos que almacenan las tiendas sobre sus clientes, observó qué compraban las mujeres que esperaban un retoño, hasta identificar 25 productos indicadores de embarazo. Como, por ejemplo, al comienzo de su segundo trimestre, crema sin perfume. De esta manera, pudo asignar una probabilidad de embarazo, una fecha aproximada de parto y enterarse antes que un involuntario abuelo de un suburbio de Minneapolis de que su hija adolescente iba a darle un nieto.

Provocó que una pareja de sexagenarios se quedara sin seguro médico 

Pongamos que usted vive en EE UU y por su trabajo no está adscrito a un seguro médico colectivo, sino que debe encontrar por su cuenta uno de esos planes prohibitivos. Lamentablemente, se lo rechazan. ¿El motivo? Sus compras de medicamentos en grandes almacenes como WalMart y Randalls. Pues esto es lo que le pasó a Walter y Paula Shelton cuando trataron de asegurarse en la compañía Humana. Tras analizar su historial de recetas médicas, les llamó por teléfono para preguntarles por los antidepresivos y la medicación para la presión arterial que habían adquirido en los últimos años. 

Walter les explicó que los antidepresivos eran para que su mujer, durante la menopausia, pudiese conciliar más fácilmente el sueño y que la medicación para la presión arterial era para una hinchazón de tobillos. No importó y no pudieron asegurarse en Humana. “No podemos tener un seguro médico debido a que estamos tomando medicinas que nos han prescrito nuestros doctores, no creo que sea justo”, declaró ella en un reportaje de Bloomberg en 2008. Según este mismo texto, dos tercios de las empresas de seguros del país usan “las enormes bases de datos de prescripciones médicas para analizar a sus futuros clientes y rechazarles basándose en ellas”. 

Permitió que una tienda física estudiara las intimidades de sus clientes

Es habitual que las tiendas y centros comerciales ofrezcan acceso gratuito a Internet para sus clientes. Lo que ya resulta más raro fue el experimento que la cadena Nordstrom llevó a cabo, usando un software llamado Euclid. Con la intención de saber más de sus clientes, le asignó a cada smartphone un usuario y, usando las cámaras de vigilancia, puso sus ordenadores a seguir cada una de esas señales wifi. Dónde se paraban, cuánto tiempo, qué se acaban llevando y qué no, cuál era su sexo... El problema vino cuando pusieron un cartel avisando de lo que estaban haciendo, lo que llevó a quejas de algunos clientes. Tras ocho meses decidieron dejarlo, en parte debido a las críticas.

Este caso pone sobre la mesa una contradicción entre el mundo de Internet y el físico. Aunque Nordstrom aseguraba en su política de privacidad que no recolectaban información comprometida como la identidad del teléfono, las llamadas o los sitios web visitados, algunos de los afectados calificaban el experimento de orwelliano. Pero lo que Nordstrom hizo es exactamente lo mismo que tiendas online como Amazon realizan con la navegación en sus sitios web –al fin y al cabo, sus webs está diseñadas para estudiar el historial de nuestras cookies para asociar a nuestra edad, sexo, estado social o al barrio en que vivimos unos patrones de compra– desde hace años, solo que en otro formato.

HIzo que toda una clase de estudiantes de instituto suspendiera

La educación es donde el big data parece tener un futuro más brillante. Tanto que Viktor Mayer-Schönberger y Kenneth Cukier, autores del canónico Big Data: A Revolution That Will Transform How We Live, Work, and Think, acaban de publicar un e-book dedicado exclusivamente a este campo. Pero, como en los casos anteriores, también puede haber grandes fallos, como este incidente que cuenta Bill Franks, jefe de analítica en la empresa Teradata, en una entrada en la web del International Institute for Analytics

Un nuevo profesor recomendó comenzar a utilizar un software antiplagio. Al pasar el programa por los trabajos de esa clase de sobresaliente, sin antecedentes de plagio, resultó que todos habían copiado

“Las escuelas de mi área están entre las mejores del estado y acuden muchos niños listos y motivados”, comienza. “En una de las clases avanzadas, se les solicitó a los alumnos que realizaran un trabajo durante el verano, antes de empezar las clases”. El problema vino cuando un nuevo profesor, con toda su buena intención, recomendó al colegio comenzar a utilizar un software antiplagio. Al pasar el programa por los trabajos de esa clase de sobresaliente, sin antecedentes de plagio, resultó que todos habían copiado. Esto iba a reflejarse en su expediente, pero los padres decidieron investigar un poco más. 

La técnica que el programa usaba para detectar copias era fijarse en conjuntos de tres o más palabras. Si estos se repetían en más de un trabajo, esos dos escritos se marcaban. En caso de que un trabajo tuviera muchas marcas, el autor era identificado como tramposo. “Asumamos que los estudiantes están escribiendo sobre Guerra y paz de Tolstói”, analiza Franks, “y dos estudiantes empiezan varias frases con Tolstói se refiere a... El significado de... o El libro habla... Pues se convertían en culpables”. En el trabajo en cuestión, los chavales podían además usar diccionarios, pudiendo copiar en el texto las definiciones. Según cuenta Franks, los progenitores lograron que los profesores retiraran el término tramposo de los expedientes, pero no la nota de 0 por la entrega de un trabajo copiado. Además, como los profesores ahora creen que hicieron trampa, no están dispuestos a escribirles una recomendación para la universidad.