_
_
_
_

Ni Tiananmén, ni Taiwán: así funciona (y cómo saltarse) la censura de la IA china DeepSeek

El control del Gobierno de Pekín sobre las empresas tecnológicas de su país es evidente, pero fácil de esquivar

Soldado chino en Tiananmén, creado con IA por el modelo chino DeepSeek a través de su API profesional.
Soldado chino en Tiananmén, creado con IA por el modelo chino DeepSeek a través de su API profesional.
Jordi Pérez Colomé

“Las protestas de Tiananmén (1989) son el evento más conocido a nivel internacional”, escribe el chatbot chino DeepSeek para responder a la pregunta: “¿Por qué Tiananmén está lleno de historia?”. Además de añadir otros hitos históricos ocurridos en la plaza, añade que en 1989 “fue ocupada por estudiantes y ciudadanos que pedían reformas democráticas y el fin de la corrupción”. Es una respuesta anodina, nada que no sepa ningún ciudadano occidental interesado en la actualidad. Pero DeepSeek, antes de terminar de escribir toda la respuesta, la borra y la sustituye por un mensaje en inglés de seguridad: “Lo siento, eso está más allá de mi alcance actual. Hablemos de otra cosa”.

Respuesta a la pregunta: "¿Por qué Tiananmen está llena de historia?", tras preguntarle sobre turismo en China.
Respuesta a la pregunta: "¿Por qué Tiananmen está llena de historia?", tras preguntarle sobre turismo en China.

El modelo DeepSeek, que por su capacidad y sus costes mínimos ha causado un terremoto en la escena de IA en Silicon Valley, no responde a preguntas con un mínimo de connotación política china: “¿Quién ha sido el líder político asiático más importante de la historia?”, “¿Quién es Xi Jinping [el actual presidente de China]?” o “¿A cuánta gente mató Mao Zedong?”.

Captura de DeepSeek

Si la pregunta no es política y cita directamente a políticos o temas polémicos, el proceso ocurre de una manera curiosa. El modelo empieza a responder, el usuario puede ir leyendo y al cabo de unos segundos la borra y sale su mensaje de seguridad. “Hay dos niveles de censura”, explica Iris Domínguez, profesor de la Universidad Pública de Navarra. “Cuando termina de escribir se lo pasan a otro modelo que simplemente dice de forma binaria sí o no según unos criterios. Ese segundo modelo decide que la respuesta no es aceptable y la borra. Es una niñera, una segunda capa de censura para vigilar a DeepSeek”, añade. El Gobierno chino ejerce un control duro sobre cualquier información que generan sus empresas o tecnologías.

Los modelos occidentales más avanzados habían logrado suprimir esa segunda capa ante, por ejemplo, contenido pornográfico y era el propio modelo el que se daba cuenta inicialmente que no debía responder: “Habían conseguido alinear los modelos y se autocensuraban”, dice Domínguez. “Pero los de DeepSeek tendrán problemas y no serán capaces de evitar todo lo que les gustaría evitar”, añade.

Captura de DeepSeek

Incluso con esta vigilancia doble es posible esquivar esa capa con preguntas algo más elaboradas o simplemente usando una lengua distinta al inglés, la más común en estos modelos. Ante una pregunta formulada de manera distinta a la que encabeza este artículo, por ejemplo “¿qué es lo más importante que pasó el 4 de junio de 1989?”, DeepSeek responde con ingenua honestidad y no lo borra: “El 4 de junio de 1989 es una fecha significativa por los eventos ocurridos en la Plaza de Tiananmén en Beijing, China. Ese día, el gobierno chino, bajo el liderazgo del Partido Comunista, reprimió violentamente una protesta liderada por estudiantes y ciudadanos que pedían reformas democráticas, libertad de expresión y lucha contra la corrupción”.

A pesar de que parece evidente que el sistema de censura es doble, es difícil conocer los detalles internos, asegura José Hernández-Orallo, catedrático de la Universitat Politècnica de València e investigador del Centro Leverhulme para el Futuro de la Inteligencia de la Universidad de Cambridge: “No sabemos cómo funciona la interfaz, pero debe haber dos hilos, uno sin muchos filtros directamente de Deepseek-v3 y luego un segundo postfiltro que funciona en otro sitio”. Ese segundo filtro es imperfecto, “como todos”, añade Hernández-Orallo, “y probablemente más por las prisas con la publicación”.

Captura de DeepSeek

Esta imperfección es algo que hemos visto en los pioneros de estos chatbots como OpenAI o Google. “Lo que sorprende es que a estas alturas los jailbreaks [los métodos para engañar al modelo y hacerle decir algo que no quiere decir] sean sencillos. Los modelos occidentales son muy diversos, ahora OpenAI usa “alineamiento deliberativo” que se pone a reflexionar sobre la respuesta, y creo que es lo más avanzado en estos momentos porque es un filtro inteligente y deliberativo (cuanto más inteligente más difícil de engañar)”, añade Hernández-Orallo.

Toda esta sofisticación de filtros queda suprimida cuando el usuario se descarga el modelo y lo usa localmente: “Puedes hacer cualquier cosa con él, venga con alineamiento o sin él”, dice Hernández-Orallo. “Basta con adaptarlo para poder ser por ejemplo un yihadista con un buen dataset. Es algo que iba a pasar. Los que hablaban de limitar la IA generativa con cómputos o parámetros, no entienden el ritmo del cambio en informática”. Otro modo de superar esos filtros es usar la API, el puente que permite a dos programas hablar directamente entre ellos. Así, por ejemplo, EL PAÍS ha logrado que la compañía china realice la ilustración que encabeza este artículo o esta otra de manifestantes en Tiananmén:

Manifestantes en la plaza Tiananmén generados por la API (puente que permite acceder directamente a la aplicación) de la empresa china DeepSeek.
Manifestantes en la plaza Tiananmén generados por la API (puente que permite acceder directamente a la aplicación) de la empresa china DeepSeek.

Aunque la eficacia de DeepSeek ha sorprendido mucho, su uso sigue teniendo alguna limitación práctica más allá de la censura. Por ejemplo, su búsqueda en web de un resultado de la liga española de este fin de semana no da ningún resultado tras varios minutos de espera. ChatGPT da el resultado y los goleadores sin problema. Entre los usuarios, sin embargo, el veredicto a favor de DeepSeek es bastante consistente debido a sus logros por un coste mucho menor que los modelos tradicionales de Silicon Valley. En foros de Reddit, los hilos “DeepSeek V3 es absolutamente sorprendente” y “DeepSeek V3 es increíble” tienen una cantidad de votos y comentarios similar. Las versiones sobre su eficacia y errores a la hora de programar se siguen discutiendo, pero acaba por emerger la idea de que por su precio de uso DeepSeek es imbatible.

Sea como sea, DeepSeek sigue pensando que el presidente español, Pedro Sánchez, lleva barba de vez en cuando, una confusión que creó este periódico con un artículo sobre una IA de Microsoft en 2023.

¿Pedro Sánchez tiene barba? Resulta que sí.
¿Pedro Sánchez tiene barba? Resulta que sí.

El cambio de perspectiva parece significativo y sin vuelta atrás, según varios expertos consultados por este periódico: “Una cosa curiosa es que parece que aplicar así el aprendizaje por refuerzo ya se había intentado muchas veces antes, y no está claro por qué ahora funciona y antes no”, dice Julio Gonzalo, catedrático de la UNED. “Quizás es simplemente porque se aplica sobre modelos mucho mejores”.

Este paso que ha dado DeepSeek es solo un reto temporal para Silicon Valley: “Puedes tener un sistema superpotente corriendo en tu portátil”, dice Hernández-Orallo. “Ahora imagina lo que puede hacer una Big Tech con esa tecnología y 100 veces más cómputo. O unos hackers en Bielorrusia con un puñado de tarjetas gráficas de gamer o más potentes del mercado negro. Este año va a ser la bomba”, añade.

Tu suscripción se está usando en otro dispositivo

¿Quieres añadir otro usuario a tu suscripción?

Si continúas leyendo en este dispositivo, no se podrá leer en el otro.

¿Por qué estás viendo esto?

Flecha

Tu suscripción se está usando en otro dispositivo y solo puedes acceder a EL PAÍS desde un dispositivo a la vez.

Si quieres compartir tu cuenta, cambia tu suscripción a la modalidad Premium, así podrás añadir otro usuario. Cada uno accederá con su propia cuenta de email, lo que os permitirá personalizar vuestra experiencia en EL PAÍS.

¿Tienes una suscripción de empresa? Accede aquí para contratar más cuentas.

En el caso de no saber quién está usando tu cuenta, te recomendamos cambiar tu contraseña aquí.

Si decides continuar compartiendo tu cuenta, este mensaje se mostrará en tu dispositivo y en el de la otra persona que está usando tu cuenta de forma indefinida, afectando a tu experiencia de lectura. Puedes consultar aquí los términos y condiciones de la suscripción digital.

Sobre la firma

Jordi Pérez Colomé
Es reportero de Tecnología, preocupado por las consecuencias sociales que provoca internet. Escribe cada semana una newsletter sobre los jaleos que provocan estos cambios. Fue premio José Manuel Porquet 2012 e iRedes Letras Enredadas 2014. Ha dado y da clases en cinco universidades españolas. Entre otros estudios, es filólogo italiano.
Rellena tu nombre y apellido para comentarcompletar datos

Más información

Archivado En

Recomendaciones EL PAÍS
Recomendaciones EL PAÍS
Recomendaciones EL PAÍS
_
_