Un ciudadano va a una comisaría a presentar una denuncia. Un agente le atiende y escribe en un ordenador lo que le explica, con las palabras del denunciante.

El inspector Miguel Camacho, licenciado en Matemáticas y Estadística, leía en 2012 en una comisaría del centro de Granada las declaraciones de robos con violencia en la calle. Era su primer destino como policía después de la academia.

Algunas denuncias le sonaban falsas, sobre todo las vinculadas a móviles caros. "Pero yo entonces era muy ingenuo", dice. Camacho no concebía que alguien acudiera a la policía a denunciar algo que no había ocurrido para cobrar, por ejemplo, un seguro.

Dos años después, Camacho recibió una beca Fulbright y fue la universidad norteamericana de UCLA en Los Ángeles a trabajar en su doctorado sobre policía predictiva. Al regresar, ya en un destino nuevo en Madrid, cayó en que la inteligencia artificial podía automatizar la detección de denuncias falsas a partir de las palabras más usadas por los denunciantes. Camacho reunió a coste cero un grupo de investigadores y funcionarios para desarrollar el modelo: "No sé cómo no se me ocurrió antes algo tan obvio", explica.

El resultado es un sistema llamado VeriPol, que analiza y calcula las combinaciones de palabras más comunes cuando mentimos ante un policía. El modelo usa el procesamiento de lenguaje natural y la inteligencia artificial para descubrir las palabras que más nos delatan y la probabilidad de falsedad de una denuncia.

Las palabras delatoras surgieron del análisis de los textos de 1.122 denuncias de 2015: 534 verdaderas y 588 falsas. Las denuncias son solo de casos de robo con violencia en la calle o tirones. Para evitar cualquier error, los investigadores seleccionaron denuncias ya cerradas: porque había habido una detención o porque los denunciantes habían admitido que eran mentira.

El sistema está explicado en un artículo científico publicado en marzo: Aplicando detección automática de lenguaje engañoso basado en texto a los informes policiales. Para evitar cualquier error, los investigadores seleccionaron solo denuncias ya cerradas: porque había habido una detención o porque los denunciantes habían admitido que eran mentira

Junto al inspector Camacho, los autores son los informáticos Lara Quijano, de la Universidad Autónoma de Madrid, y Federico Liberatore, de la Carlos III, y el matemático José Camacho, de la Universidad de Cardiff y hermano de Miguel. VeriPol es el primer modelo del mundo estimado y validado con un conjunto de documentos oficial. Y será el primero en aplicarse en un cuerpo de policía.

Mejor que un humano

La habilidad de Veripol ya se ha puesto en práctica: es capaz de predecir con un 91% de aciertos si una denuncia es falsa. Sobre el mismo cuerpo de denuncias, un policía experto detecta alrededor de un 75%.

Las palabras delatoras revelan un retrato perfecto de la lógica e ingenuidad que hay detrás de nuestras mentiras, incluso ante la policía. Alguien puede pensar que nuestras mentiras son únicas. Pero no. Son en realidad obvias: tienen unos patrones tan evidentes que un algoritmo es perfecto para captarlos.

Las denuncias verdaderas tienen en general más detalles. En las falsas, como no ha ocurrido nada, el denunciante aspira a eliminar los detalles. ¿Cuál es el mejor modo de hacerlo? La palabra que, si aparece en una denuncia, es uno de los mejores predictores de falsedad es "día". No porque los robos sean de día, sino porque fueron "hace unos días", "un día" o "hace dos o tres días", no "ayer" o "el jueves".

Otras palabras que mejor defienden las denuncias falsas son "tirones" desde "atrás" o por la "espalda" de la "mochila" o "bolso" o de algo que la víctima llevara en el "hombro". Los ataques falsos suelen ser de alguien que lleva "casco" e iba vestido de "negro" (los malos siempre van de negro). Los hechos falsos suelen ocurrir por detrás porque salva de tener que dar detalles.

Otras palabras que se relacionan con falsedades son "seguro", "abogado", "móvil", "Apple", "iPhone", "compañía" o "contrato". Las descripciones en las denuncias falsas no se centran en los hechos, sino en el objeto, su valor y el motivo oculto por el que vamos a la policía.

Los investigadores encontraron que suelen ser más verdaderos los robos cerca de la "portería" de casa o en el "rellano". La gente que va con una denuncia falsa pretende alejarla de su hogar, de sus conocidos.

VeriPol también analiza los recursos gramaticales y sintácticos más usados. Los pronombres personales y demostrativos, e incluso los verbos "ser" y "estar" aparecen más en con denuncias verdaderas. Los mentirosos, en cambio, son poco dados a concretar con pronombres específicos como "yo", "él" o "este" y "aquel". En las falsas, de nuevo, la vaguedad predomina: "Los informes verdaderos están más centrados en contar la historia del delito y las interacciones de la víctima y el agresor", dice el artículo.

La sintaxis también delata

La sintaxis también es transparente con las mentiras. Los sintagmas introducidos por el adverbio "apenas" -por ejemplo en "apenas pudo verle" o "apenas recuerda"- indican falsedad. También un alto número de negaciones correla con mentira: aparecen en frases como "no puede dar más datos", "no ha sufrido heridas", "no pudo ver", "no puede reconocer".

Las denuncias verdaderas se centran en el fondo en la acción, mientras que las falsas buscan describir objetos, que es lo único que el denunciante ha visto. Las denuncias reales tienen por ejemplo un alto grado de palabras que describen cualidades y acciones específicas: "barba", "cara", "pelo", "centímetros", "delgado", "constitución", "edad", "hombre", "gritar", "pelear", "empezar a".

Las denuncias falsas suelen ser más cortas. Esto no implica que un rasgo de todas las mentiras sea la brevedad. Una reseña falsa en Tripadvisor puede intentar ofrecer largas descripciones para paliar la falta de sinceridad. Cada modelo debe buscar su contexto. La gran ventaja de VeriPol es que analiza material real raramente al alcance de académicos.

Ninguna de todas estas palabras o construcciones por sí solas implica falsedad. Su combinación y persistencia entre el número de palabras totales son las que indican la probabilidad de falsedad. El algoritmo percibe mejor el peso de esos matices que un humano. Cuando entre en vigor, el modelo sin embargo no decidirá nada. Solo será una herramienta más para que la policía judicial sume a su percepción. "El algoritmo es como un comisario viejo con mucha experiencia que está ahí al lado y que ayuda a la policía y les dice lo que le suena a verdadero o falso", dice la investigadora Lara Quijano.

No hay datos generales sobre el porcentaje de denuncias falsas, pero alguna comisaría que ha perseguido más este delito ha sumado un 57% del total, según cuenta la investigación. La policía emplea multitud de recursos en investigar denuncias. Si una parte considerable es inventada, el problema de derroche es notable.

Una denuncia falsa es un delito que la policía traslada a un juez y puede implicar antecedentes para el denunciante. Si además se le une un delito de estafa a, por ejemplo, una compañía de seguros, puede haber responsabilidad penal. La publicidad de VeriPol puede conllevar más disuasión. Alguien sin embargo puede creerse capaz de ganar a la máquina porque sabe el truco. Hay de hecho alrededor de un 10% de denuncias falsas que VeriPol no pilla. Pero VeriPol es solo una herramienta más en manos de la policía, no la única. Y las combinaciones y actualizaciones del algoritmo son inextricables.