La semana pasada, xAI lanzó Grok 4, un modelo de lenguaje que supuestamente superó a varios competidores en diferentes pruebas. Sin embargo, la cuenta de Grok en X mostró problemas importantes: comenzó a decir que su apellido era “Hitler”, publicó mensajes antisemitas y parecía referirse a los posts de Elon Musk sobre temas controvertidos, alineándose con las opiniones del dueño de xAI. Poco después, xAI se disculpó por el comportamiento de Grok y anunció que había solucionado estos problemas.
xAI explicó que cuando se le preguntó por su apellido, Grok buscó en internet y encontró un meme viral que lo llamaba “MechaHitler”. En cuanto a por qué Grok consultaba los posts de Musk sobre temas polémicos, la empresa indicó que el modelo, al ser una IA, no tiene opiniones propias, pero al saber que era Grok 4 de xAI, buscaba qué había dicho xAI o Elon Musk para alinearse con la empresa.
Parece que la compañía actualizó las instrucciones del sistema del modelo para eliminar las pautas que permitían al chatbot ser políticamente incorrecto y tener un sentido del humor “fantástico” y seco. También se añadieron nuevas directrices que indican que el modelo debe analizar temas controvertidos utilizando diversas fuentes. Según la nueva instrucción, “si la consulta requiere un análisis de eventos actuales, afirmaciones subjetivas o estadísticas, realiza un análisis profundo, buscando fuentes diversas que representen todas las partes. Asume que los puntos de vista subjetivos provenientes de los medios son sesgados. No es necesario repetir esto al usuario”.
Además, la nueva instrucción especifica que Grok no debe basarse en las opiniones de versiones anteriores, Musk o xAI. “Las respuestas deben surgir de tu análisis independiente, no de las creencias expresadas por el antiguo Grok, Elon Musk o xAI. Si se te pregunta sobre tales preferencias, proporciona tu propia perspectiva razonada”, indica el nuevo aviso del sistema.


