Ser científico de datos puede ser menos sexi de lo que te han contado
La profesión mejor valorada de nuestro tiempo podría desinflarse con la proliferación de herramientas que automatizan los procesos para desarrollar algoritmos de aprendizaje automático
“Te quiero a ti para mi departamento de ciencia de datos”. Este podría ser el lema que defendiera un Tío Sam actual y corporativo a la caza de los mejores talentos para incrementar beneficios empresariales. Al fin y al cabo, ¿qué organización que se precie no quiere tener uno entre sus filas? La profesión de moda —la revista Harvard Business Review lo definía hace unos años como el trabajo más sexi del siglo XXI— sigue creciendo y puede presumir de haberse convertido en una de las más demandadas en nuestros días. La profusión de información de la que disponemos actualmente exige a gritos un ejército de perfiles técnicos capaz de interpretar aquello que los datos se empeñan en transmitirnos.
En este ecosistema de idilio para los profesionales que se han lanzado en brazos de la ciencia de datos prolifera un actor que podría cambiar sustancialmente el panorama. Grandes corporaciones tecnológicas de la talla de Google, Amazon o Microsoft y startups más modestas desarrollan herramientas para automatizar los procesos de aprendizaje automático, un fenómeno que, a largo plazo, podría reducir la demanda de estos perfiles.
“El aprendizaje automático es un proceso de la inteligencia artificial utilizado por los científicos de datos para obtener información o sacar valor de un conjunto de datos. Sin embargo, es un proceso iterativo y, por lo tanto, consume mucho tiempo”, explica Ingrid Burton, responsable de marketing de H2O.ai, una de estas startups. “El aprendizaje automático automatizado o AutoML es una técnica relativamente nueva en ciencia de datos que automatiza el proceso repetitivo y lento de creación y optimización de modelos”. En resumen, podríamos decir que estas herramientas simplifican el trabajo de los científicos de datos y les permiten realizar su tarea de manera rápida y eficiente.
La proliferación de estas soluciones ha aprovechado un momento en el que las empresas encuentran dificultades para encontrar personal técnico con la formación necesaria para entrenar modelos de aprendizaje automático. “La labor de procesar la información necesita de gente con una amplia formación en estadística y matemáticas”, advierte Mikel Coira, responsable de LUCA Suite, la herramienta de AutoML de la unidad de datos de Telefónica. “Con estas herramientas, pretendemos automatizar todo lo que se pueda automatizar para que el científico de datos pueda dedicar sus esfuerzos a la parte donde pueda aportar valor”.
Cada vez habrá más herramientas que faciliten el trabajo con datos a los expertos en determinados dominios
Francisco Martín es el CEO de BigML
Coira apunta que su herramienta simplifica procesos en las empresas que trabajan con científicos de datos, pero que también pueden resultar de utilidad a compañías que no cuentan con estos perfiles pero disponen de datos estructurados. Porque AutoML democratiza el aprendizaje automático hasta el punto de que profesionales de otras áreas puedan sacar conclusiones de los datos sin ser unos genios de la estadística.
Salesforce es una de las empresas que ha comenzado a ofrecer este servicio y presume de que su uso puede ser transversal a cualquier departamento. “Con AutoML se reduce de manera drástica la complejidad técnica y analítica de los entornos de aprendizaje automático tradicionales”, señala Pau Contreras, vicepresidente de Ingeniería de Soluciones de la compañía. “El departamento de marketing puede saber cuándo enviar un correo electrónico para que tenga más posibilidades de ser leído y los responsables de comercio electrónico podrán conocer los productos que mejor se adaptan a los gustos de los consumidores”.
No obstante, a pesar de sus innumerables ventajas, la democratización de la inteligencia artificial podría tener un impacto negativo para quienes se hayan adentrado en la profesión atraídos ante la idea de que nunca les faltará trabajo.
Francisco Martín es el CEO de BigML, una compañía que lleva ocho años trabajando en este tipo de herramientas y, por tanto, una de las pioneras en este campo. Su opinión al respecto es tan radical como partidista: sostiene que la profesión de científico de datos tal y como la conocemos hoy dejará de existir en los próximos años. “Cada vez habrá más herramientas que faciliten el trabajo con datos a los expertos en determinados dominios”, pronostica. “A día de hoy, es más fácil que un experto en medicina, marketing, leyes o ingeniería industrial con el apoyo de un herramienta consiga añadir valor a una empresa que esperar que un grupo de científicos de datos lo haga de forma independiente”.
Martín defiende que un experto en aprendizaje automático nunca va a poder competir con la velocidad con la que estas herramientas encuentran el mejor modelo y valora de materialmente imposible que un humano diseñe, ejecute y evalúe miles de modelos en pocos minutos. “Un experto puede ayudar a definir las métricas y a optimizar las variables que ayuden en la estrategia general. Es como en el ajedrez, donde es imposible ganar a las máquinas en las tácticas pero sí en la estrategia”, expone.
El desarrollo de estas herramientas se encuentra todavía en una fase prematura. Todavía es pronto para afirmar que las máquinas podrían llegar a quitar el trabajo a una de las profesiones más prometedoras que ha traído consigo la transformación digital.
Tu suscripción se está usando en otro dispositivo
¿Quieres añadir otro usuario a tu suscripción?
Si continúas leyendo en este dispositivo, no se podrá leer en el otro.
FlechaTu suscripción se está usando en otro dispositivo y solo puedes acceder a EL PAÍS desde un dispositivo a la vez.
Si quieres compartir tu cuenta, cambia tu suscripción a la modalidad Premium, así podrás añadir otro usuario. Cada uno accederá con su propia cuenta de email, lo que os permitirá personalizar vuestra experiencia en EL PAÍS.
En el caso de no saber quién está usando tu cuenta, te recomendamos cambiar tu contraseña aquí.
Si decides continuar compartiendo tu cuenta, este mensaje se mostrará en tu dispositivo y en el de la otra persona que está usando tu cuenta de forma indefinida, afectando a tu experiencia de lectura. Puedes consultar aquí los términos y condiciones de la suscripción digital.