Artículos estrictamente de opinión que responden al estilo propio del autor. Estos textos de opinión han de basarse en datos verificados y ser respetuosos con las personas aunque se critiquen sus actos. Todas las columnas de opinión de personas ajenas a la Redacción de EL PAÍS llevarán, tras la última línea, un pie de autor —por conocido que éste sea— donde se indique el cargo, título, militancia política (en su caso) u ocupación principal, o la que esté o estuvo relacionada con el tema abordado

El mono ladrón inmortal

La teoría de la probabilidad dice que hasta los eventos más improbables pueden ocurrir, siempre que haya suficiente tiempo, recursos y oportunidades

Marta Peirano

15 abr 2024 - 05:00CEST

Compartir en Facebook

Compartir en Twitter

Compartir en Bluesky

Compartir en Linkedin

Copiar enlace

Ir a los comentarios

¿Podría un mono inmortal, tecleando aleatoria e infinitamente en una máquina de escribir, producir Hamlet palabra por palabra? En La biblioteca de Babel, Borges describe una biblioteca infinita que contiene todos los libros que podrían ser escritos. La teoría de la probabilidad dice que hasta los eventos más improbables pueden ocurrir, siempre que haya suficiente tiempo, recursos y oportunidades. Si la industria tecnológica es una secta, esta es su religión.

En la ideología del Valle, cualquier problema puede ser solucionado con suficiente dinero, tiempo, programadores y potencia de computación. Pocos casos más ilustrativos que Theranos, el unicornio de Elizabeth Holmes. La “innovadora”, “disruptiva” y “pionera” empresa que prometía revolucionar la medicina con una máquina capaz de hacer análisis complejos a partir de una sola gota de sangre no se dejó desalentar por las leyes de la física y la estadística, que decían que no hay glóbulos suficientes en una muestra tan pequeña para detectar un cáncer, un embarazo o una artritis. Ahora Holmes cumple condena por fraude, pero el Valle no ha corregido su error.

En el mundo de la inteligencia artificial, esta religión se manifiesta como las “leyes de escalamiento o escalabilidad”. No son leyes reales, pero dicen que lo único que nos separa de la Inteligencia Artificial General son ordenadores más potentes, programadores más listos y más bases de datos para entrenar los modelos de IA. Lo primero está ya consumiendo más agua, oxígeno y energía que un país europeo mediano. Lo segundo está por ver. Lo tercero es menos problemático, pero solo si ignoras la calidad, origen y licencia del contenido original.

Los primeros modelos de IA fueron entrenados con los frutos de la web 2.0: blogs, webzines, posts, tuits, pins, reddits y todas las demás manifestaciones de la Red social. También con el contenido de bibliotecas, periódicos, archivos universitarios y otros contenedores de material trabajosamente digitalizado durante los últimos 20 años. La reciente investigación de Christo Buschek y Jer Thorp sobre LAION-5B demuestra que la selección es más oportunista que deliberada.

Los métodos de selección de contenidos para alimentar la IA son puramente automatizados, sin intervención humana alguna, y están supeditados a la accesibilidad y pre-etiquetado de las muestras, no a su calidad. Tampoco hay supervisión, ni la habrá nunca. “Alguien que trabajara ocho horas al día, cinco días a la semana revisando cada imagen de esta base de datos durante al menos un segundo, tardaría 781 años en mirarlo todo”, dicen Buschek y Thorp. Esto explica por qué aparecen imágenes de explotación de menores en los modelos comerciales de IA. Estaban bien etiquetadas. Estaban en internet.

El método no ha cambiado. Mira Murati, jefa de seguridad de OpenAI, declaró recientemente que habían entrenado Sora, su modelo de generación de video, con “datos públicos”. No quiere decir “en el dominio público” sino pescados indiscriminadamente de YouTube, Instagram o TikTok. No están solos. En las pruebas del juicio de The New York Times contra OpenAI, vemos que los abogados de Meta aconsejaron robar lo que haya disponible y enfrentarse a posibles demandas, mejor que perder tiempo esperando a que editores, artistas o músicos firmen contratos de cesión. Dicen que Google no ha querido demandar a OpenAI porque probablemente está haciendo lo mismo que ellos. A quién le sirve un mono que tiene que robar, estafar y quemar el planeta para escribir Hamlet. Para qué es.

Tu suscripción se está usando en otro dispositivo

¿Quieres añadir otro usuario a tu suscripción?

Añadir usuario Continuar leyendo aquí

Si continúas leyendo en este dispositivo, no se podrá leer en el otro.

¿Por qué estás viendo esto?

Flecha

Tu suscripción se está usando en otro dispositivo y solo puedes acceder a EL PAÍS desde un dispositivo a la vez.

Si quieres compartir tu cuenta, cambia tu suscripción a la modalidad Premium, así podrás añadir otro usuario. Cada uno accederá con su propia cuenta de email, lo que os permitirá personalizar vuestra experiencia en EL PAÍS.

¿Tienes una suscripción de empresa? Accede aquí para contratar más cuentas.

En el caso de no saber quién está usando tu cuenta, te recomendamos cambiar tu contraseña aquí.

Si decides continuar compartiendo tu cuenta, este mensaje se mostrará en tu dispositivo y en el de la otra persona que está usando tu cuenta de forma indefinida, afectando a tu experiencia de lectura. Puedes consultar aquí los términos y condiciones de la suscripción digital.

Sobre la firma

Marta Peirano

Escritora e investigadora especializada en tecnología y poder. Es analista de EL PAÍS y RNE. Sus libros más recientes son 'El enemigo conoce el sistema. Manipulación de ideas, personas e influencias después de la economía de la atención' y 'Contra el futuro. Resistencia ciudadana frente al feudalismo climático'.