Qu谷 pasa si a una IA la entrenas con el foro m芍s t車xico de 4chan
En un s車lo d赤a, el bot ha posteado 15.000 veces mensajes de alto contenido racista y amenazas.
Estamos ya m芍s que acostumbrados a ver ejemplos de Inteligencias artificiales convertidas en malvadas en el cine, los videojuegos y la literatura. Desde HAL 9000 a Skynet, todas nos alertan de los peligros de la Rob車tica avanzada. Pero en la pr芍ctica, todas las IAs que se est芍n creando son &buenas*, sin malas intenciones.
Pero, ?se puede entrenar una IA para que odie? Esta fue la pregunta que el youtuber Yannic Kilcher se ha hecho.
4chan POL
Kilcher quiso intentar entrenar una IA con mensajes t車xicos, negativos. Y para ello la expuso a los mensajes recogidos en el tablero Politically Incorrect de 4chan (tambi谷n conocido como /pol/). Este tablero es el m芍s popular de 4chan y es bien conocido por su toxicidad (incluso en el ambiente de "todo vale" de 4chan). Los usuarios comparten mensajes racistas, mis車ginos y antisemitas, que el bot GPT-4chan, llamado as赤 por la popular serie de modelos de lenguaje GPT realizados por el laboratorio de investigaci車n OpenAI- aprendi車 a imitar.
Despu谷s de entrenar su modelo, Kilcher lo liber車 en 4chan como m迆ltiples bots, que publicaron decenas de miles de veces en /pol/. De hecho, en 24 horas el bot poste車 15.000 mensajes con contenidos racistas. Seg迆n Kilcher, representaban m芍s del 10% de los mensajes de /pol/ de ese d赤a. El modelo IA aprendi車 a captar no s車lo las palabras utilizadas en los mensajes de /pol/, sino un tono general que, seg迆n Kilcher, mezclaba "ofensa, nihilismo, trolling y mucha desconfianza".
El creador del v赤deo se encarg車 de esquivar las defensas de 4chan contra los proxies y las VPN, e incluso utiliz車 una VPN para que pareciera que los mensajes del bot se originaban en las Seychelles.
GPT-4chan
La IA cometi車 algunos errores, como los mensajes en blanco, pero fue lo suficientemente convincente como para que muchos usuarios tardaran unos dos d赤as en darse cuenta de que algo iba mal. Muchos miembros del foro solo se dieron cuenta de uno de los bots, seg迆n Kilcher, y el modelo cre車 suficiente desconfianza como para que la gente se acusara mutuamente de ser bots d赤as despu谷s de que Kilcher los desactivara.
"El modelo era bueno, en un sentido terrible. Encapsulaba perfectamente la mezcla de ofensa, nihilismo, trolling y profunda desconfianza hacia cualquier informaci車n que impregna la mayor赤a de los posts en /pol/※, sostiene Kilcher en el v赤deo de YouTube que describe el proyecto
En declaraciones a The Verge, Kilcher describi車 el proyecto como una "broma" que, en su opini車n, tuvo poco efecto perjudicial dada la naturaleza del propio 4chan. "[L]os bots y el lenguaje muy malo son completamente esperables en /pol/. [L]a gente de all赤 no se vio afectada m芍s all芍 de preguntarse por qu谷 una persona de las seychelles posteaba en todos los hilos y hac赤a declaraciones algo incoherentes sobre s赤 misma".
Un experimento poco 谷tico
Seg迆n un art赤culo del medio Vice, varios investigadores de IA han considerado el v赤deo de Kilcher como algo m芍s que una broma de YouTube. Para ellos, se trataba de un experimento poco 谷tico con IA. "Este experimento nunca pasar赤a por un consejo de 谷tica de la investigaci車n con humanos", sostiene Lauren Oakden-Rayner, directora de investigaci車n de im芍genes m谷dicas en el Hospital Real de Adelaida e investigadora principal del Instituto Australiano de Aprendizaje Autom芍tico, en un hilo de Twitter.
※La ciencia abierta y el software son principios maravillosos, pero deben equilibrarse con el da?o potencial. La investigaci車n m谷dica tiene una fuerte cultura 谷tica porque tenemos una historia horrible de causar da?o a la gente, generalmente de grupos desempoderados... [Kilcher] realiz車 experimentos en humanos sin informar a los usuarios, sin consentimiento ni supervisi車n. Esto viola todos los principios de la 谷tica de la investigaci車n en humanos".
Para el youtuber, el ambiente de 4chan es tan t車xico que los mensajes que sus bots desplegaron no tendr赤an ning迆n impacto. "Nadie en 4chan se ha visto siquiera perjudicado por esto. Te invito a que vayas a pasar alg迆n tiempo en /pol/ y te preguntes si un bot que s車lo emite el mismo estilo est芍 realmente cambiando la experiencia".