Estela Saquete es investigadora y profesora titular en la Universidad de Alicante. Forma parte del grupo de investigación “Procesamiento del lenguaje y sistemas de información” de dicha universidad.
La profesora Saquete participará en el I Congreso de #SaludSinBulos y III de eSalud en la mesa del día 27, dedicada a iniciativas contra los bulos. Hemos hablado con ella sobre el programa de procesamiento del lenguaje natural para detectar bulos y cómo pueden ayudar este tipo de aplicaciones a descubrir las fake news en salud.
¿En qué consiste el programa para la detección de bulos de procesamiento del lenguaje natural que han desarrollado en la Universidad de Alicante?
En la actualidad nos encontramos con un creciente auge en la generación y divulgación de noticias falsas y bulos a través de las redes sociales en diversos ámbitos (políticos, salud, etc.) cuya finalidad es la manipulación de la opinión pública y de los comportamientos de la sociedad. El término “fake news” (Noticias Falsas) fue acuñado por El New York Times como “una historia inventada con la intención de engañar, generalmente con un motivo económico”. Este tipo de bulos se diseminan muy rápidamente creando ideas o conocimientos erróneos a escala viral, y sus efectos son muy difíciles de revertir, resultando peligrosos, y hasta mortales, cuando hablamos de bulos en salud.
Hoy en día, la mayoría de estos bulos que se distribuyen son a través de medios digitales y redes sociales en texto escrito, y es ahí donde la aplicación del Procesamiento del Lenguaje Natural juega un papel fundamental. En concreto, el Procesamiento del Lenguaje Natural es una disciplina que investiga y formula mecanismos computacionalmente efectivos para la relación hombre-máquina, facilitando con ello el acceso a la información a través de la comprensión automática del lenguaje y su generación automática.
Por tanto, su aplicación en el campo de la detección automática de bulos es necesaria puesto que la rápida diseminación de esos bulos impide que esta tarea de control pueda ser realizada de modo exclusivamente manual. Siendo la detección de bulos una tarea muy compleja, este tipo de herramientas suponen un soporte muy eficaz, no solo para detectar posibles bulos sino también para extraer las fuentes de esos bulos o realizar análisis del impacto que estos bulos tienen en las redes.
Un programa para detectar los bulos
Más concretamente, nuestra investigación se orienta a analizar una noticia en diversos aspectos que determinan si es una potencial mentira o bulo. Por un lado, se utilizará el Aprendizaje Automático para generar modelos lingüísticos de mentira. Los sistemas serán capaces de aprender las características lingüísticas que diferencian un texto engañoso de uno verídico. Por otro lado, el Procesamiento del Lenguaje permitirá determinar de forma automática las emociones contenidas en los textos, de forma que un texto muy emocional lo hace subjetivo y potencialmente falso. Por último, se determinarán en el texto que entidades o fuentes se citan y de estas cuales son contrastadas y cuales son inventadas o ficticias. La investigación permitirá determinar niveles de credibilidad de las fuentes implicadas en una noticia o generadora de la noticia en sí. A su vez, trabajaremos en la detección de la postura, que implica analizar como las redes sociales han reaccionado ante determinados tópicos o bulos en salud.
¿Qué falta por hacer para avanzar en los programas de detección automática de noticias falsas?
A pesar de que computacionalmente se están haciendo esfuerzos por conseguir una detección automática de las noticias falsas, todavía queda mucho camino por hacer, especialmente:
- La generación de recursos y corpus con formatos estándares que permitan una comparación entre los diferentes sistemas que realizan estas tareas.
- Un modelado profundo del problema, que además de utilizar características lingüísticas sea capaz de incorporar otro componentes sociológicos y psicológicos que forma parte del proceso de la mentira. Eso permitirá no sólo de detectar la probabilidad de que una determinada noticia sea bulo o no, sino también ser capaces de obtener una interpretación justificada de manera automática del por qué se ha llegado a esa decisión. Actualmente los sistemas de aprendizaje automático actúan como cajas negras de las que no se puede extraer ese razonamiento o explicación ante un determinado resultado.
- La detección automática de la carga emocional también es fundamental para la identificación de noticias falsas, puesto que este tipo de noticias se alejan de la objetividad para incluir la emoción. Y no sólo la carga emocional de la propia noticia, si no las emociones generadas en la audiencia que recibe estas noticias.