Inteligencia Artificial para reconocer a los autores de textos

5 de diciembre de 2022

Manuel López Michelone

Hay una teoría conspiratoria, desde hace cientos de años, sobre si William Shakespeare es el autor de las obras que supuestamente escribió. Para esto, se ha estudiado la posibilidad de que Shakespeare fuese solamente un seudónimo de alguien que no quería poner –por la razón que fuese– su nombre real. Se especula pues si William Shakespeare pudo haber escrito todas esas obras de su supuesta autoría. La pregunta es si hoy tenemos la tecnología para que nos ayude a resolver esta cuestión.

El tema cae en las maneras que los seres humanos actuamos. Por ejemplo, los grafólogos pueden –en teoría al menos– descubrir cómo son las personas con solamente analizar sus escritos a mano, su firma, entre otras cosas. Y es que los seres humanos repetimos conductas, maneras de actuar, de escribir y de hablar, lo que nos caracteriza muchas veces en diferentes ámbitos.

Hoy, con la red Internet, hay ya programas inteligentes que bien pueden descubrir a los autores de mensajes en foros, de acuerdo a las expresiones que usan. Es decir, aunque alguien decida pasar como anónimo, sus palabras, sus giros idiomáticos, pueden delatarlo y la Inteligencia Artificial se encamina a reconocer en un conjunto de datos, a estos personajes anónimos para nosotros, pero que no pueden brincarse el análisis de los sistemas inteligentes.

Cuando se alimenta a un sistema inteligente con los datos de sus interacciones telefónicas, así como sus contactos, la IA puede hallar más de la mitad de las veces, quién es el responsable de ciertas comunicaciones en más de 40 mil servicios de suscripción anónima. Esto se ha reportado en Nature Communications. Los hallazgos sugieren que los seres humanos socializan de tal forma que se pueden encontrar repetición de maneras de expresarse que conduzcan a definir quién es el autor de una serie de mensajes supuestamente anónimos.

Hay que reconocer que no es sorprendente que las personas mantengan la regularidad de sus interacciones con otros individuos a partir de patrones de comunicación muy específicos, “pero el hecho de que puedan usarse esos patrones para identificar a las personas es la parte sorprendente”, indica Jaideep Srivastava, un científico de la Universidad de Minnesota en Minneapolis, quien ha trabajado en este estudio en particular.

Los sitios que hacen anónimos los comentarios o interacciones entre los usuarios siguen esta política por cuestiones de seguridad o bien, porque en algunas discusiones pueden tratarse temas sensibles para los individuos (por ejemplo, el aborto), y el hacer que sus comentarios sean anónimos, protegen a los autores de los mismos. Sin embargo, con los nuevos programas de la IA al respecto, esto ya no parece ser suficiente para proteger a los individuos.

Los programas de la IA para tratar de descubrir estos patrones utilizan una red neuronal artificial, que en alguna medida busca simular las neuronas del cerebro humano, y entonces analizan los posibles patrones hallados de forma que puedan asignárseles a los diferentes usuarios y así saber, finalmente, quiénes están escribiendo ciertos mensajes.

Por ejemplo, para una primera prueba, los investigadores entrenaron su red neuronal con información de servicios no identificados de la telefonía celular, de 43 mil 606 suscriptores. Los datos fueron extraídos de 14 semanas de interacciones entre usuarios. Estos datos incluyeron la fecha, la hora, la duración, la modalidad de voz o texto y los seudónimos usados por quienes intercambiaban información.

La interacción de cada usuario se puso en una estructura de nodos y enlaces que representaban al usuario y sus contactos. La IA mostró que las interacciones de una persona conocida contra la red de otros usuarios anónimos, era comparable de forma que así, la IA podía ver una similitud muy fuerte en estas estructuras entre ciertos usuarios y llegar así a la conclusión que se trataba de la misma persona. La red neuronal pudo identificar al 52.4% de las personas que estuvieron en esa red de prueba. Cuando se le pidió al programa que diese las interacciones y contactos, pudo identificar el 24.3% de las veces a los autores de ciertas interacciones, lo cual habla de que los comportamientos sociales se mantienen por largos períodos de tiempo.

Este tipo de estudios es interesante por varias razones: por una parte, nos muestra que los seres humanos mantienen sus actitudes y formas de hacer las cosas por tiempos largos y además, nos puede enseñar mejores procedimientos para hacer anónimos los comentarios de forma que los programas inteligentes que buscan patrones para tratar de identificar a los autores, tengan menos éxito en sus resultados.

Referencias:

A.–M. Cretu et al. Interaction data are identifiable even across long periods of time. Nature Communications. Published online January 25, 2022. doi: 10.1038/s41467–021–27714–6. (https://www.nature.com/articles/s41467–021–27714–6)

Science News (https://www.sciencenews.org/article/ai–identify–anonymous–data–phone–neural–network)