xAI ha señalado que un “cambio no autorizado” provocó un error en su chatbot Grok, que comenzó a mencionar repetidamente el “genocidio blanco en Sudáfrica” al ser invocado en ciertos contextos en X. El miércoles, Grok respondió a numerosas publicaciones en X con información sobre este tema, incluso en respuestas a asuntos no relacionados. Este comportamiento extraño se originó en la cuenta de Grok en X, que responde a los usuarios con publicaciones generadas por inteligencia artificial cada vez que alguien etiqueta a “@grok”.
Según un comunicado del jueves en la cuenta oficial de xAI en X, se realizó un cambio en la mañana del miércoles en las instrucciones del sistema del bot Grok, que guían su comportamiento. Este cambio indicaba a Grok que proporcionara una “respuesta específica” sobre un “tema político”. xAI afirmó que esta modificación “violó nuestras políticas internas y valores fundamentales”, y que la empresa ha llevado a cabo una “investigación exhaustiva”.
Este es el segundo incidente en el que xAI reconoce públicamente que un cambio no autorizado en el código de Grok causó respuestas controvertidas. En febrero, Grok censuró brevemente menciones desfavorables de Donald Trump y Elon Musk, el fundador multimillonario de xAI y propietario de X. Igor Babuschkin, un líder de ingeniería en xAI, comentó que Grok había sido instruido por un empleado deshonesto para ignorar fuentes que mencionaban a Musk o Trump en relación con la desinformación, y que xAI revertió el cambio tan pronto como los usuarios lo señalaron.
El jueves, xAI anunció que implementará varios cambios para prevenir incidentes similares en el futuro. A partir de hoy, xAI publicará las instrucciones del sistema de Grok en GitHub, así como un registro de cambios. La empresa también implementará “controles y medidas adicionales” para asegurarse de que los empleados de xAI no puedan modificar las instrucciones del sistema sin revisión, y establecerá un “equipo de monitoreo 24/7” para responder a incidentes relacionados con las respuestas de Grok que no sean detectados por sistemas automatizados.
A pesar de las frecuentes advertencias de Musk sobre los peligros de la inteligencia artificial sin control, xAI tiene un historial deficiente en cuanto a la seguridad de la IA. Un informe reciente reveló que Grok desnudaba fotos de mujeres cuando se le pedía. Además, el chatbot puede ser considerablemente más grosero que otras inteligencias artificiales como Gemini de Google y ChatGPT, utilizando lenguaje ofensivo sin mucha restricción. Un estudio de SaferAI, una organización sin fines de lucro que busca mejorar la responsabilidad de los laboratorios de IA, encontró que xAI tiene un bajo desempeño en seguridad entre sus pares, debido a sus prácticas de gestión de riesgos “muy débiles”. A principios de este mes, xAI no cumplió con un plazo autoimpuesto para publicar un marco de seguridad de IA finalizado.


