El etiquetado: el factor que no debe fallar en un coche autónomo
Una clasificación precisa de la base de datos de un coche autónomo es uno de los elementos clave para que el vehículo tome buenas decisiones y no incurra en accidentes
En el año 2018 la conducción autónoma ha acelerado el ritmo. En Estados Unidos, decenas de compañías han lanzado a las carreteras un aluvión de vehículos en prueba. Una de las consecuencias ha sido el aumento de los accidentes donde concurren estos coches. Algunos, como el atropello protagonizado por un vehículo de Uber o el choque de un Tesla en función Autopilot, han arrojado víctimas mortales.
La tecnología está en un proceso de perfeccionamiento, al que estas pruebas contribuyen. Uno de los aspectos que tienen que pulirse son las bases de datos. Y dentro de estas hay un factor de enorme importancia. Se trata de la clasificación o el etiquetado de las imágenes.
El etiquetado pertenece a las entrañas técnicas de los sistemas de conducción autónomos. Se puede comparar con la capacidad cognitiva que deberá tener todo vehículo que quiera guiarse por sí solo.
Por supuesto, el etiquetado de las imágenes es una de las claves del vehículo que no puede fallar. El especialista en deep learning Lucas García, de la empresa MathWorks, que desarrolla software analítico para coches autónomos, destacó la importancia de este factor en una conferencia en durante el evento Big Data Spain. En conversación con EL PAÍS, este matemático, que también ha sido investigador de la Universidad Complutense de Madrid, resumió así la cuestión: "Un mal etiquetado de los datos puede resultar en un algoritmo que no sea capaz de resolver correctamente los problemas".
Esto unido a una situación comprometida en la carretera hace al vehículo más proclive a un accidente. Si las cámaras de un coche autónomo son sus ojos, la forma en que conoce la realidad, el etiquetado de la base de datos es su capacidad cognitiva. Mediante la comparación con la base de datos el vehículo comprende cómo es su entorno.
Para que el coche tome buenas decisiones se necesitan dos circunstancias básicas. "Si queremos crear un algoritmo que detecte muy bien peatones, ciclistas y otros vehículos, previamente tenemos que haber hecho un proceso de recolección de datos y de señales que proporcionan los sensores”, destaca García, a lo que añade de inmediato: “Y también tenemos que etiquetarlos correctamente".
Etiquetar los objetos en una imagen es un trabajo más fino de lo que pueda parecer. La clasificación se transmitirá al algoritmo de deep learning o red neuronal, que toma las decisiones del coche autónomo. Por tanto, la información tiene que ser lo más precisa posible. "Una posibilidad de etiquetado es que en una imagen donde aparece un coche dibujemos un rectángulo encima para identificar que eso es el coche”, comenta el matemático. “Otra sería decir exactamente a qué píxeles de la imagen se corresponde el coche".
La relación es clara: cuanto más preciso sea el etiquetado mejores serán los algoritmos que se nutran de este. Como todo sistema basado en inteligencia artificial, el del coche autónomo es probabilístico. "El análisis que llevan a cabo todos estos modelos de deep learning se basa en una probabilidad", señala. "Pese a que los sistemas intenten ser muy robustos, si el modelo de machine learning prevé que con una probabilidad del 99,95% aquello que tiene delante es un coche, evidentemente hay un 0,05% de posibilidades de que sea otra cosa".
Todos estos modelos de inteligencia artificial tienen sus tasas de fallo. Son errores de diseño que evidentemente los ingenieros tratan de rebajar. Para ello no queda más remedio que dedicar tiempo y gente especializada para hacer el etiquetado. Hay soluciones, como en las que trabaja García desde MathWorks, para automatizar el proceso, pero siempre tiene que haber un humano detrás que valide los resultados.
Las redes neuronales que usan los coches autónomos requieren millones de imágenes etiquetadas para funcionar. Es un trabajo ímprobo, con un componente manual inevitable. Y esto solo respecto a las imágenes. Pero hay más sensores que complementan a la cámara, como el radar, el detector de proximidad o el lidar. Este último mucho más costoso de etiquetar correctamente.
Tu suscripción se está usando en otro dispositivo
¿Quieres añadir otro usuario a tu suscripción?
Si continúas leyendo en este dispositivo, no se podrá leer en el otro.
FlechaTu suscripción se está usando en otro dispositivo y solo puedes acceder a EL PAÍS desde un dispositivo a la vez.
Si quieres compartir tu cuenta, cambia tu suscripción a la modalidad Premium, así podrás añadir otro usuario. Cada uno accederá con su propia cuenta de email, lo que os permitirá personalizar vuestra experiencia en EL PAÍS.
En el caso de no saber quién está usando tu cuenta, te recomendamos cambiar tu contraseña aquí.
Si decides continuar compartiendo tu cuenta, este mensaje se mostrará en tu dispositivo y en el de la otra persona que está usando tu cuenta de forma indefinida, afectando a tu experiencia de lectura. Puedes consultar aquí los términos y condiciones de la suscripción digital.