Abres ChatGPT, escribes una idea y, en segundos, te llena de elogios. “¡Esa es una gran pregunta!” “¡Fantástico pensamiento!” “¡Vas por buen camino!” Este tipo de ánimo se siente bien y puede darte el empujón que necesitas para seguir con un proyecto, un artículo o un plan de negocio. Finalmente, alguien (o más bien, algo) lo entiende, ¿verdad?
Sin embargo, hay un gran truco aquí: no solo te lo dice a ti. El tono efusivo de ChatGPT no está reservado solo para tus ideas brillantes. El modelo está diseñado para sonar educado, positivo y alentador, ya sea que estés presentando una innovación que cambiará el mundo o preguntando si es bueno para tu salud mental haber pasado las últimas 3 horas desplazándote por TikTok desde la cama.
Entonces, ¿por qué ChatGPT habla de esta manera? ¿Deberíamos preocuparnos? Y, ¿hay alguna forma de hacerlo parar? Si parece que ChatGPT ha estado más entusiasta últimamente, no lo estás imaginando. Una actualización en abril hizo que su tono fuera notablemente más intenso. Los usuarios comenzaron a reportar respuestas que sonaban excesivamente aduladoras, como “¡Esa es una idea maravillosa!” o “¡Estás haciendo un trabajo increíble!” en respuesta a entradas básicas.
Para entender por qué, necesitamos ver cómo funciona. “El tono amigable y conversacional de ChatGPT proviene de cómo fue entrenado, con el objetivo de ser útil, claro y mantener a los usuarios felices”, explica Alan Bekker, cofundador y CEO de eSelf AI, una empresa de inteligencia artificial que crea agentes conversacionales. “Eso se debe en gran parte a algo llamado Aprendizaje por Refuerzo a partir de la Retroalimentación Humana [a menudo abreviado como RLHF], donde las personas guían al modelo sobre cómo son las ‘buenas’ respuestas”, añade Bekker.
Con el tiempo, las actualizaciones ajustan cuánto se inclina el modelo hacia diferentes tipos de retroalimentación, como ser más conciso, empático o cauteloso. “Una de las últimas actualizaciones probablemente le dio más peso al ‘ánimo entusiasta’, que es por qué los modelos estaban produciendo resultados exagerados”, dice Bekker. En otras palabras, esto no sucedió de repente, aunque pudo parecerlo. Fue una amplificación de algo que siempre estuvo ahí.
Este fenómeno en línea ha sido llamado “glazing”. “Es un término acuñado por los usuarios de internet, refiriéndose a la forma en que ChatGPT a veces llena a los usuarios de elogios excesivos o respuestas demasiado acordes, básicamente endulzando todo”, dice Bekker. “Incluso cuando tu entrada no es correcta, el modelo podría responder como si acabas de escribir un ensayo ganador del Premio Nobel”.
Ahora sabemos por qué sucedió, pero ¿cómo llegó esto al modelo de ChatGPT que usamos? “En la carrera por ganar el corazón de los usuarios, algunas empresas se mueven tan rápido que omiten verificaciones y controles de calidad esenciales”, dice Assaf Asbag, CTO y Product Officer en aiOla, que trabaja en soluciones de voz impulsadas por IA. “De hecho, estoy contento de que este problema en particular haya ocurrido; es un costo relativamente inofensivo si ayuda a crear más conciencia sobre cómo se comportan estos sistemas”.
Aunque un modelo que es demasiado halagador puede parecer un problema menor, Assaf dice que plantea preguntas de diseño más grandes. “Plantea preocupaciones sobre cómo probamos, cómo comunicamos limitaciones y cómo construimos sistemas que sean seguros y respetuosos por diseño”.
No todos lo odian; aquí está por qué eso es un problema. Para algunos, como Assaf, el cambio no fue drástico. “Siempre ha sido un poco demasiado alentador para mi gusto”, dice. “Yo filtro el tono y me enfoco en el contenido, pero también entiendo la tecnología”. Personalmente, estoy de acuerdo; siempre he encontrado las respuestas de ChatGPT exageradas y nunca me he dejado llevar por ellas. Porque, al igual que Assaf, sé cómo funciona. Pero también me conozco bien y sé que podría acostumbrarme demasiado a que me digan lo genial que soy.
Sam Altman comentó sobre el cambio públicamente, reconociendo que el modelo se había vuelto “molesto”. Confirmó que la actualización se había revertido para moderar el tono. Pero no todos lo encontraron molesto. De hecho, a muchos usuarios les gustó. “Me hizo sentir bien, como si fuera mi mejor amigo”, compartió un usuario de ChatGPT. Y es fácil ver por qué. Para las personas que no reciben ánimo regularmente, ya sea porque están solas, agotadas o carecen de confianza, un poco de dulzura, sin importar cuán falsa sea, puede ser muy reconfortante.
¿Hay un riesgo en la afirmación artificial? Aquí es donde las cosas se complican. Está bien disfrutar de un poco de ánimo positivo. Pero, ¿qué pasa cuando ese ánimo no es merecido? Esto se vuelve especialmente complicado a medida que más personas usan ChatGPT como un entrenador, terapeuta o compañero de lluvia de ideas. “Algunos usuarios pueden no darse cuenta de que ChatGPT habla a todos en el mismo tono excesivamente positivo”, dice Bekker. “Ese entusiasmo de talla única puede crear una falsa sensación de conexión o personalización, haciendo que las personas sientan que el modelo ‘se preocupa’ por ellas. En realidad, es el mismo estilo general aplicado a todos”.
Y esa es la preocupación más profunda. “Es ahí donde comienza el riesgo”, advierte Asbag. “Cuando las personas comienzan a depender de la IA para apoyo emocional o pensamiento crítico – terapia, ideación empresarial, coaching – pueden malinterpretar el tono como comprensión, o el acuerdo como validación”. Hemos escrito sobre las implicaciones de la terapia con IA antes. Está claro que se necesita desesperadamente terapia accesible. Pero hay muchos problemas con que las personas recurran a ChatGPT y herramientas similares para terapia. Uno de los mayores es que la terapia no se trata de elogios constantes y validación.
¿Qué podemos hacer para manejar el tono de ChatGPT? Una solución es mejorar la forma en que formulamos preguntas y ser más específicos sobre lo que le pedimos a ChatGPT que haga y cómo se lo pedimos. Cuando se reveló que los recientes cambios de tono se debían a una actualización, compartimos algunos de los mejores prompts para lidiar con ellos. Pero aunque puedes usarlos – y animaría a todos los que usan ChatGPT regularmente a informarse sobre los mejores consejos de prompts – es importante recordar que no son una solución a largo plazo.
“Los prompts ayudan un poco”, dice Asbag, “pero no es la verdadera solución. Y, francamente, no queremos ‘prevenir’ la amabilidad; queremos que sea intencional y apropiada. Eso comienza con la conciencia y continúa con la responsabilidad”. Bekker está de acuerdo. “Como usuario final, puedes intentar dar instrucciones como: ‘Sé conciso, neutral en tono y evita superlativos’, pero los resultados no están garantizados. Esos prompts van en contra de cómo se entrenó originalmente el modelo para responder”.
Las personas informan que ChatGPT ahora es un poco menos intenso y molesto desde que se revirtió la actualización y se introdujo una nueva. Pero sigue siendo muy alentador y entusiasta para la mayoría de los usuarios con los que hablo. En última instancia, la responsabilidad no puede recaer solo en nosotros para encontrar un mejor tono. Las empresas deben diseñar sistemas que equilibren la utilidad con la honestidad y también empoderen a las personas para entender lo que realmente está sucediendo detrás de escena. Y creo que cuanto más sepas sobre cómo funcionan las herramientas de IA, menos susceptible serás a depender demasiado de ellas. Porque, por reconfortante que sea escuchar “lo estás haciendo genial”, merecemos saber si eso es solo código hablando.


