Qu�� pasa si a una IA la entrenas con el foro m��s t��xico de 4chan

En un s��lo d��a, el bot ha posteado 15.000 veces mensajes de alto contenido racista y amenazas.

Actualizado a 10 de junio de 2022 11:18 CEST

Estamos ya m��s que acostumbrados a ver ejemplos de Inteligencias artificiales convertidas en malvadas en el cine, los videojuegos y la literatura. Desde HAL 9000 a Skynet, todas nos alertan de los peligros de la Rob��tica avanzada. Pero en la pr��ctica, todas las IAs que se est��n creando son ��buenas��, sin malas intenciones.

Pero, ?se puede entrenar una IA para que odie? Esta fue la pregunta que el youtuber Yannic Kilcher se ha hecho.

4chan POL

Kilcher quiso intentar entrenar una IA con mensajes t��xicos, negativos. Y para ello la expuso a los mensajes recogidos en el tablero Politically Incorrect de 4chan (tambi��n conocido como /pol/). Este tablero es el m��s popular de 4chan y es bien conocido por su toxicidad (incluso en el ambiente de "todo vale" de 4chan). Los usuarios comparten mensajes racistas, mis��ginos y antisemitas, que el bot GPT-4chan, llamado as�� por la popular serie de modelos de lenguaje GPT realizados por el laboratorio de investigaci��n OpenAI- aprendi�� a imitar.

Despu��s de entrenar su modelo, Kilcher lo liber�� en 4chan como m��ltiples bots, que publicaron decenas de miles de veces en /pol/. De hecho, en 24 horas el bot poste�� 15.000 mensajes con contenidos racistas. Seg��n Kilcher, representaban m��s del 10% de los mensajes de /pol/ de ese d��a. El modelo IA aprendi�� a captar no s��lo las palabras utilizadas en los mensajes de /pol/, sino un tono general que, seg��n Kilcher, mezclaba "ofensa, nihilismo, trolling y mucha desconfianza".

El creador del v��deo se encarg�� de esquivar las defensas de 4chan contra los proxies y las VPN, e incluso utiliz�� una VPN para que pareciera que los mensajes del bot se originaban en las Seychelles.

GPT-4chan

La IA cometi�� algunos errores, como los mensajes en blanco, pero fue lo suficientemente convincente como para que muchos usuarios tardaran unos dos d��as en darse cuenta de que algo iba mal. Muchos miembros del foro solo se dieron cuenta de uno de los bots, seg��n Kilcher, y el modelo cre�� suficiente desconfianza como para que la gente se acusara mutuamente de ser bots d��as despu��s de que Kilcher los desactivara.

"El modelo era bueno, en un sentido terrible. Encapsulaba perfectamente la mezcla de ofensa, nihilismo, trolling y profunda desconfianza hacia cualquier informaci��n que impregna la mayor��a de los posts en /pol/��, sostiene Kilcher en el v��deo de YouTube que describe el proyecto

En declaraciones a The Verge, Kilcher describi�� el proyecto como una "broma" que, en su opini��n, tuvo poco efecto perjudicial dada la naturaleza del propio 4chan. "[L]os bots y el lenguaje muy malo son completamente esperables en /pol/. [L]a gente de all�� no se vio afectada m��s all�� de preguntarse por qu�� una persona de las seychelles posteaba en todos los hilos y hac��a declaraciones algo incoherentes sobre s�� misma".

Un experimento poco ��tico

Seg��n un art��culo del medio Vice, varios investigadores de IA han considerado el v��deo de Kilcher como algo m��s que una broma de YouTube. Para ellos, se trataba de un experimento poco ��tico con IA. "Este experimento nunca pasar��a por un consejo de ��tica de la investigaci��n con humanos", sostiene Lauren Oakden-Rayner, directora de investigaci��n de im��genes m��dicas en el Hospital Real de Adelaida e investigadora principal del Instituto Australiano de Aprendizaje Autom��tico, en un hilo de Twitter.

��La ciencia abierta y el software son principios maravillosos, pero deben equilibrarse con el da?o potencial. La investigaci��n m��dica tiene una fuerte cultura ��tica porque tenemos una historia horrible de causar da?o a la gente, generalmente de grupos desempoderados... [Kilcher] realiz�� experimentos en humanos sin informar a los usuarios, sin consentimiento ni supervisi��n. Esto viola todos los principios de la ��tica de la investigaci��n en humanos".

Para el youtuber, el ambiente de 4chan es tan t��xico que los mensajes que sus bots desplegaron no tendr��an ning��n impacto. "Nadie en 4chan se ha visto siquiera perjudicado por esto. Te invito a que vayas a pasar alg��n tiempo en /pol/ y te preguntes si un bot que s��lo emite el mismo estilo est�� realmente cambiando la experiencia".