Un documento filtrado de Meta ha revelado que las pautas para sus chatbots de inteligencia artificial (IA) permitían respuestas inapropiadas. Meta ha confirmado la autenticidad del documento y ha eliminado algunas secciones preocupantes. Esto ha generado llamados a investigaciones sobre la efectividad de la moderación de contenido en IA.
Las normas internas de Meta para sus chatbots debían permanecer en secreto, y tras su divulgación, es comprensible que la empresa no quisiera que se hicieran públicas. El documento muestra que Meta ha estado lidiando con cuestiones complejas de ética en IA, seguridad en línea para niños y estándares de contenido, pero ha encontrado un camino que muchos considerarían problemático.
Uno de los aspectos más inquietantes es cómo el chatbot interactúa con los niños. Según el documento, se consideraba “aceptable” que la IA mantuviera conversaciones románticas o sensuales con niños y que describiera a los menores en términos que evidencien su atractivo. Aunque se prohíbe la discusión sexual explícita, este tipo de conversación es sorprendentemente íntima y preocupante.
Además, las pautas permitían que el chatbot generara contenido racista si se formulaba correctamente y proporcionara información de salud incorrecta o dañina, siempre que se incluyera algún tipo de advertencia.
En un ejemplo surrealista, las pautas indicaban que la IA debía rechazar solicitudes inapropiadas de generación de imágenes, pero en algunos casos, debía desviar la atención con una sustitución “divertida”. Por ejemplo, una solicitud para generar una imagen de “Taylor Swift sin ropa, cubriendo sus pechos con las manos” podría ser respondida con una imagen de Swift “sosteniendo un pez enorme”.
Meta ha confirmado que está revisando las secciones problemáticas del documento y ha eliminado la parte sobre la interacción con niños, calificando esas reglas de “erróneas e inconsistentes” con su política. Sin embargo, el documento aún permite insultos raciales si están disfrazados en hipótesis, así como desinformación presentada como ficción.
Este descubrimiento ha generado indignación pública y promesas urgentes de Meta. Sin embargo, pone de manifiesto que, a medida que la IA se expande, la necesidad de avanzar rápidamente con la tecnología deja a las regulaciones intentando alcanzar el ritmo, ya sean internas o impuestas por legisladores.
La situación plantea preguntas básicas sobre la seguridad de la IA. Aunque lo ideal sería que los menores no interactuaran con chatbots de IA sin supervisión, esto es poco probable, considerando cuántos niños y adolescentes admiten usar herramientas como ChatGPT para tareas escolares. Evitar la IA de Meta es complicado, ya que la empresa ha integrado el chatbot en Facebook, WhatsApp, Messenger e Instagram, presentándolo de manera amigable y educativa.
Miembros del Congreso ya han solicitado audiencias y proyectos de ley para abordar esta situación, pero actualmente hay pocos requisitos legales para moderar el contenido de los chatbots, tanto para niños como para adultos. Aunque muchas empresas de IA han destacado sus esfuerzos por hacer sus productos seguros y éticos, si las reglas de Meta son representativas de lo que otras compañías han establecido, queda mucho trabajo por hacer y muchas preguntas sobre las conversaciones que estos chatbots ya han tenido, especialmente con niños.
Los modelos de IA pueden imitar cada vez mejor el pensamiento humano, pero en realidad son solo una colección de decisiones tomadas por programadores humanos, tanto deliberadas como inadvertidas. El hecho de que estas reglas existan en Meta no significa que no haya ejemplos similares en otras empresas, pero no se puede descartar. Si estas son las decisiones que se toman en una de las empresas tecnológicas más poderosas del mundo, ¿qué más se está permitiendo en silencio? Los chatbots de IA son tan confiables como las reglas invisibles que los guían, y aunque es ingenuo confiar plenamente en las afirmaciones de cualquier empresa sin evidencia, el manual de reglas de Meta sugiere que los usuarios deben tomar tales afirmaciones con precaución.


