10 claves para que las organizaciones humanitarias aprovechen el ‘big data’
Nuevos tipos de datos pueden ayudar a tener información de poblaciones vulnerables en tiempo real que de otro modo tardaríamos meses en conseguir o no podríamos obtener
Debido a la creciente digitalización de nuestra vida, cuando usamos el teléfono móvil, las redes sociales, los buscadores, tarjetas de crédito... estamos generando una cantidad masiva de datos. El big data está de moda, y haciendo uso de la ciencia de los datos, las organizaciones pueden tomar mejores decisiones en tiempo real basadas en evidencias y modelos predictivos.
La revolución digital es global y el uso de nuevas fuentes de datos también es una oportunidad para hacer más efectivo el trabajo de las organizaciones humanitarias. Nuevos tipos de datos pueden ayudar a tener información de poblaciones vulnerables en tiempo real que de otro modo tardaríamos meses en conseguir y además a precios muy altos, o incluso, como en el caso de países en conflicto, información que directamente no podríamos obtener.
Ya hay ejemplos que muestran cómo el big data puede ayudar al desarrollo sostenible y a la acción humanitaria. El análisis de la información compartida en las redes sociales sirve para identificar rumores falsos que crean opiniones erróneas sobre temas tan importantes como la vacunación; los datos agregados de patrones de tráfico de telefonía móvil permiten predecir cómo se mueven las poblaciones y cómo se propagan enfermedades como la malaria o el cólera; la red de distribución de agua en un campo de refugiados se puede optimizar gracias al análisis de los datos de sensores en los tanques de agua; los datos postales permiten analizar las conexiones entre distintos puntos de la geografía y tener una visión en tiempo real de cómo funciona la economía mundial. Incluso es posible entender cómo se recuperan económicamente las regiones afectadas por catástrofes naturales a través del análisis de las transacciones financieras.
El big data no es el nuevo petróleo como muchos dicen, sino la nueva energía verde. Los datos se pueden reciclar completamente y reutilizar para otros propósitos sostenibles. Si trabajas en el sector humanitario o en el lado de los números, estas son 10 de las barreras que hay que superar:
1. Identificar los verdaderos problemas
El análisis de big data no es una solución, sino una herramienta para resolver un problema existente. Analizar los datos simplemente porque tenemos acceso a ellos puede no tener valor para tu organización. Por eso, definir primero el problema de manera muy precisa es imprescindible para no desviarnos del objetivo perdiéndonos en datos que no nos ayudan. Si eres un responsable de un programa probablemente tendrás que realizar varias iteraciones para definir el proyecto y refinar el enunciado de tu problema. Muchas veces no sabemos lo que no sabemos. La fase de diseño de un proyecto tarda tanto tiempo como la de implementación. Buscar inspiración en otros ejemplos es clave.
Esta guía te muestra paso a paso cómo diseñar un proyecto de innovación con datos.
2. Los datos por sí mismos no te dan conocimiento
El acceso a la fuente de datos es solo el principio del camino. Para destilar información necesitas metodologías claras, la existencia de estudios previos y un buen equipo. Y también aliados y socios con quienes colaborar. No hay magia, y probablemente el discurso en los medios simplifica demasiado lo que es posible hacer y lo que no con el big data. En este enlace tienes ejemplos de proyectos de innovación con datos de UN Global Pulse.
3. Encontrar terapeutas y traductores de datos
Normalmente, las personas que trabajan con datos y las que lo hacen en un contexto humanitario no hablan el mismo idioma: no comparten vocabulario ni son capaces de alinear sus objetivos. Las organizaciones necesitan perfiles híbridos: por ejemplo traductores capaces de interpretar ambas partes de la discusión. Muchas veces, lo que creemos que es un problema de big data no lo es y además ya tiene una solución probada y sencilla. Todo lo que necesitas es algunas sesiones de terapia de datos con alguien que te aconseje y te guie en los primeros pasos.
Esta es la composición multidisciplinar de los equipos de los labs de UN Global Pulse.
4. Validar los sistemas que utilizan big data con datos tradicionales
Tienes que entender cuál es la relación entre las fuentes de big data y el mundo real. Uno de los pasos fundamentales para asegurarnos de la validez de las innovaciones es hacer un estudio retrospectivo que compara los resultados obtenidos mediante fuentes de datos tradicionales con los obtenidos con las fuentes de big data. Además, es importante señalar que el procesado de grandes cantidades de información consta típicamente de dos etapas: la preparación de los datos y el análisis. Aunque limpiar y preparar los números se puede considerar un arte, es una ciencia, y como tal requiere de metodologías robustas y probadas. No es necesario reinventar la rueda en cada proyecto.
Esta investigación estima niveles de pobreza en función de metadatos agregados de uso de telefonía móvil y valida los resultados con encuestas demográficas y de salud.
5. Hacer ingeniería inversa de la representatividad de las fuentes
Esperar que las fuentes de big data hagan un muestreo perfecto de toda la sociedad no es realista. Lo interesante es que muchas veces, en lugar de tener datos de un 0,1% de la población estadísticamente representativo, tenemos una fuente de datos que cubre al 30% de la población, pero con unas características demográficas particulares. Hay que asumirlo y aprovecharse de ello.
En esta investigación se obtiene una aproximación de las estadísticas de desempleo en España utilizando información extraída de redes sociales.
6. La caja negra no tiene corazón (todavía)
Cualquier proyecto que tenga que ver con datos tiene que respetar unos principios de privacidad. Antes de empezar es necesario realizar una evaluación para ser conscientes de los riesgos que puede representar para individuos y grupos de personas acceder o usar ciertos datos. Los riesgos no solo están relacionados con el acceso a información, sino también con los métodos de análisis y procesado. Algunos algoritmos que funcionan como cajas negras, porque están programados por inteligencia artificial, pueden tener comportamientos discriminatorios. Por ejemplo, un algoritmo de selección de personal para un puesto de trabajo podría resultar machista si la máquina ha aprendido a puntuar mejor a los candidatos de sexo masculino porque ha inferido que en esa empresa suelen llegan a posiciones más altas. En un futuro muy cercano tendremos que decidir cómo incluir los principios de los derechos humanos en sistemas de inteligencia artificial.
Estos son los principios de privacidad de datos que utiliza UN Global Pulse y un informe reciente de la Casa Blanca sobre el futuro de la inteligencia artificial.
7. La desigualdad es creciente
Las compañías privadas más poderosas están creando estructuras que les permiten tomar decisiones basadas en datos para sus negocios. Este campo de trabajo está aún dando sus primeros pasos, así que la barrera de entrada es relativamente baja. Sin embargo, el crecimiento es exponencial, por lo que si el sector público y las organizaciones humanitarias esperan demasiado para establecer sus unidades de especialistas de datos, puede que sea demasiado tarde y caro. Hay muchas estructuras posibles que una organización puede usar: desde un equipo pequeño de traductores de datos y servicios externalizados, hasta un equipo de ciencia de datos centralizado que sirva a toda la organización, o múltiples unidades pequeñas de expertos distribuidas en los diversos departamentos.
Data Science Africa es un fórum único que reúne a una comunidad de expertos y estudiantes aplicando ciencia de los datos para desarrollo y acción humanitaria.
8. Encontrar el momento adecuado para introducir innovaciones durante las emergencias
Antes de probar una innovación basada en datos en una emergencia, debes de haber realizado una prueba de concepto o prototipo basado en un análisis retrospectivo o en una simulación. A partir de ahí, la clave será encontrar ese delicado equilibrio que permite introducir nuevos métodos en los protocolos de actuación existentes sin perturbarlos, respetando las características y presiones a las que se ven sometidos los trabajadores humanitarios durante las emergencias. La co-creación de prototipos con el usuario final en el terreno es fundamental para la que las nuevas herramientas sean de verdad útiles.
El informe de ACNUR Beyond Technology 2015 muestra varios ejemplos de innovaciones introducidas en emergencias.
9. Los datos no siempre dicen lo que quieres escuchar
Muchas veces, el ruido es mayor que la señal y los datos no muestran nada relevante. Otras veces, pueden decir demasiado: algo inesperado o información muy detallada que puede perjudicar a la gente que estás intentando ayudar, tus socios o incluso tu propio equipo. La confianza en las innovaciones no se gana de un día para otro.
10. Todavía no se ha medido de manera sistemática el impacto de las innovaciones con big data en el sector humanitario. Entonces, ¿qué?
La cuestión clave es: ¿qué tipo de decisiones se pueden tomar basadas en los nuevos tipos de datos? Medir el impacto de esas decisiones ayudará a crear el modelo de negocio para la adopción de más innovaciones en el campo del desarrollo sostenible y la acción humanitaria. Una vez que los trabajadores relacionados con el desarrollo entiendan el retorno de la inversión en big data basado en el impacto, entonces podremos dar un giro a la conversación y empezar a medir los costes (financieros y humanos) de no usar nuevos tipos de información, promoviendo el escalado de estas nuevas ideas.
Miguel Luengo-Oroz es Chief Data Scientist de UN Global Pulse, una iniciativa de la ONU que promueve el uso responsable de la ciencia de los datos para el bien común. Como primer científico de datos de la ONU, desde 2011, ha sido pionero en su uso para desarrollo sostenible y la acción humanitaria. Luengo-Oroz es también el fundador de malariaspot.org en la Universidad Politécnica de Madrid, una plataforma de innovación social que utiliza videojuegos, inteligencia artificial e impresión 3D para el diagnóstico de malaria y otras enfermedades globales.
Este artículo es una traducción y adaptación de Natalia Rodriguez Ibáñez del original 10 big data science challenges facing humanitarian organizations publicado en la web del equipo de innovación del Alto Comisionado de las Naciones Unidas para los Refugiados.
Tu suscripción se está usando en otro dispositivo
¿Quieres añadir otro usuario a tu suscripción?
Si continúas leyendo en este dispositivo, no se podrá leer en el otro.
FlechaTu suscripción se está usando en otro dispositivo y solo puedes acceder a EL PAÍS desde un dispositivo a la vez.
Si quieres compartir tu cuenta, cambia tu suscripción a la modalidad Premium, así podrás añadir otro usuario. Cada uno accederá con su propia cuenta de email, lo que os permitirá personalizar vuestra experiencia en EL PAÍS.
¿Tienes una suscripción de empresa? Accede aquí para contratar más cuentas.
En el caso de no saber quién está usando tu cuenta, te recomendamos cambiar tu contraseña aquí.
Si decides continuar compartiendo tu cuenta, este mensaje se mostrará en tu dispositivo y en el de la otra persona que está usando tu cuenta de forma indefinida, afectando a tu experiencia de lectura. Puedes consultar aquí los términos y condiciones de la suscripción digital.