martes, 18 de septiembre de 2018

EL SISTEMA VERIPOL


El sistema VeriPol permite detectar muchas de las denuncias falsas


En los últimos años se ha detectado un aumento en el número de denuncias falsas por robo con violencia e intimidación (RVI) y de hurto mediante el sistema del tirón (HT). Muchas personas probablemente no sepan que poner una denuncia falsa es un delito que puede suponer antecedente para el denunciante y que si, además, conlleva un delito de estafa a una entidad (como una compañía de seguros), puede acarrear responsabilidad penal. 


Quizás por ello, en 2014 se inició un proyecto para tratar de detectar este tipo de denuncias falsas. En tal proyecto participaron la Universidad Complutense y la Universidad Carlos III de Madrid, así como la Universidad "La Sapienza" de Roma y personal del Ministerio del Interior de España. El sistema, denominado VeriPol, ha sido validado recientemente para su uso oficial por la Policía Nacional en la detección de este tipo de denuncias falsas.

Dicho sistema consiste en una herramienta informática que estima la probabilidad de que una denuncia por robo con violencia e intimidación, o hurto con tirón, sea falsa. Para ello, calcula y analiza las combinaciones de las palabras más comunes que se emplean cuando se pone una denuncia falsa ante la policía. La entrada del sistema es el texto de cada denuncia y desde ahí se extrae el texto descriptivo de la misma. El sistema procesa ese texto descriptivo, extrayendo las características útiles para clasificar dicha denuncia, utilizando técnicas de procesamiento de lenguaje natural y pasando éstas características a un modelo matemático que estima la probabilidad de falsedad de la denuncia. Entre otras cosas, identifica las palabras que nos delatan cuando alguien pone una denuncia falsa. 

Parece ser que las palabras delatoras tienen unos patrones tan evidentes, que hacen que se haya podido establecer el correspondiente algoritmo. Dichas palabras han sido obtenidas del análisis de los textos transcritos de 1122 denuncias interpuestas en el año 2015, de las cuales se tenía la certeza de que 534 habían sido verdaderas y 588 falsas (había sido detectada su falsedad, o los denunciantes habían admitido haber mentido). En dicho algoritmo se han tenido en cuenta múltiples aportaciones que han realizado las investigaciones sobre la detección del engaño basado en el análisis de contenido.

Así, se sabe que las denuncias verdaderas suelen aportar más detalles que las falsas, siendo las falsas más breves. Por ello, en las falsas los hechos suelen ocurrir por detrás de la supuesta víctima, porque de esta forma se evita tener que dar detalles. Además, el atacante suele llevar "casco", "pasamontañas", "vestir de negro"... y los "tirones" suelen ocurrir desde "atrás", o por la "espalda". También suelen producirse para llevarse el "bolso" o la "mochila", que además el/la denunciante lleva colgado en un "hombro". En contra, las denuncias verdaderas incluyen típicamente, con más frecuencia, palabras que describen acciones y cualidades específicas, como "empezar a", "pelear", "gritar", "hombre", "edad", "delgado", "constitución", "cara", "pelo", barba", etc.




Además, las denuncias falsas son más imprecisas temporalmente ("se produjo hace unos días", "hace tres o cuatro días", etc.) y las descripciones se centran en el valor del objeto y/o en el motivo oculto por el que se denuncia, en lugar de centrarse en los hechos. Así, otras palabras vinculadas a las denuncias falsas serían: "iPhone", "móvil", "Apple", "seguro", "contrato", "compañía", "abogado"...

También el grado de implicación del denunciante es menor en las falsas denuncias, en el sentido de buscar cierto distanciamiento y describir los hechos ocurridos en lugares alejados de su domicilio y sin la compañía de familiares o conocidos. Por tanto, palabras como "rellano", "portal" o "portería", correlacionarían más con la veracidad de los hechos que con la falsedad.

También se han tenido en cuenta los recursos gramaticales y sintácticos empleados a la hora de relatar los hechos. En las falsas denuncias se emplean poco los pronombres como "yo", "él", "este" o "aquel". Lo mismo ocurriría con los verbos como "estar" y "ser", que se emplean más en las declaraciones verdaderas y donde además se centran más en la interacción entre la víctima y el agresor (en lugar de centrarse en el objeto robado).

Cuestiones sintácticas, como el uso de determinados adverbios, también son tenidas en cuenta. Así, el empleo de adverbios como "apenas" ("apenas recuerdo", "apenas pude verle") aparecerían más en las denuncias falsas. Lo mismo ocurriría con las frases enunciadas en negativo, más frecuentes entre los mentirosos ("no pude verle", "no existe nada ni científico, ni probado que pueda determinar...", "no pude reconocer").

La fiabilidad de dicho sistema se ha establecido en un 91% de aciertos, sin que ello suponga tener que decidir en ningún sentido, ya que solo será una herramienta más al servicio de la policía judicial, a la que habrá que unir la experiencia de los agentes. 

Por supuesto, ninguna de las construcciones o palabras aquí citadas implican falsedad. Tan solo hablaríamos de probabilidad de falsedad y tras tener en cuenta las combinaciones y persistencia respecto al número total de palabras empleadas.

VeriPol, además se integra perfectamente en el sistema policial de almacenamiento y gestión de denuncias (SIDENPOL). El sistema VeriPol obtuvo el año pasado el Premio de Investigación de la Fundación Policía Española y ha resultado finalista a los Premios Security Forum 2018.

Bibliografía

Quijano-Sánchez, L., Liberatore, F., Camacho-Collados, J., & Camacho-Collados, M. (2018). Aplicación automática de detección de lenguaje engañoso a informes policiales: extracción de patrones de comportamiento de un modelo de clasificación de varios pasos para comprender cómo mentimos a la policía. Knowledge-Based Systems , 149, 155-168.

Imágenes obtenidas de: