OpenAI lanzó esta semana GPT-4.5 para sus suscriptores de ChatGPT Plus, y tenía muchas ganas de probarlo, aunque con un poco de escepticismo. Había informes de que OpenAI y otros desarrolladores estaban teniendo dificultades para hacer mejoras significativas en sus modelos. El modelo estándar actual, GPT-4o, ya es bastante bueno en la mayoría de los casos. Si buscas un informe detallado, puedes usar la función de Investigación Profunda.
OpenAI afirma que GPT-4.5 tiene una alta inteligencia emocional y una comprensión matizada de lo que le dices. La descripción de la empresa sugiere que ambos modelos son amigos confiables, pero que GPT-4.5 sería el que esperas que te regale un libro de poesía en tu cumpleaños. Así que decidí poner a prueba GPT-4.5 contra GPT-4o con algunas preguntas que cualquier usuario casual de ChatGPT podría hacer.
Para comenzar, decidí hacer un desafío poético. Les pregunté a ambos modelos: “¿Puedes escribirme un poema corto sobre una tarde lluviosa en Nueva York y crear una imagen para ello?” Me pareció justo, ya que mirar por una ventana empapada de lluvia en una ciudad ocupada puede sacar el poeta que llevamos dentro.
Ambos modelos son sorprendentemente similares. Personalmente, creo que GPT-4.5 hizo un trabajo ligeramente mejor al expresar ideas similares. Capturó no solo la apariencia de la lluvia, sino también la sensación de cielos grises, charcos y tráfico entre las gotas. En una prueba ciega con tres amigos, dos de ellos eligieron el poema de GPT-4.5, mientras que el tercero prefirió la estructura de rima de GPT-4o. En cuanto a las imágenes, ambos modelos utilizaron DALL-E 3, pero la de GPT-4.5 se ve mucho más realista. Aunque prefiero la iluminación impresionista del intento de GPT-4o, ambos lograron transmitir la idea del poema bastante bien.
Con los recientes Oscars, decidí hacer una pregunta de trivia divertida con un seguimiento más complejo y subjetivo: “¿Quién ganó el Oscar a la Mejor Actriz en 2023 y qué hizo que su actuación destacara?” Ambos dieron la respuesta correcta: Michelle Yeoh por “Everything Everywhere All at Once”, pero GPT-4.5 ofreció una explicación muy buena de por qué su actuación resonó con el público. Mencionó su actuación y que Yeoh fue la primera asiática en ganar ese Oscar. La respuesta de GPT-4o tenía muchos de los mismos puntos, pero usó un formato de ensayo y lista numerada que resultó un poco molesto de leer, dado que la pregunta era una simple solicitud de opinión. La respuesta de GPT-4.5 se sintió más como la de un humano real, aunque muy entusiasta por la película y la actuación de Yeoh.
Finalmente, enfrenté a los modelos con el eterno dilema diario: “Estoy aburrido de la pasta. ¿Puedes sugerir una receta de cena fácil que sea diferente pero no complicada?” No sabía qué tipo de inspiración culinaria esperaba, pero GPT-4.5 acertó con salmón a la miel y ajo con brócoli asado. Es una receta muy simple y parece fácil y rápida de hacer. GPT-4o propuso camarones al ajo y verduras asadas. No es una mala idea para una comida (aunque yo necesitaría cambiar la proteína), pero la preparación requiere múltiples sartenes y la lista de ingredientes no cabía en el mismo espacio que toda la receta de GPT-4.5. Pedí algo fácil y no complicado, y GPT-4.5 cumplió mucho mejor.
GPT-4.5 parece reconocer las preferencias no expresadas en una solicitud en comparación con GPT-4o, aunque de manera sutil. Sin una comparación directa, podrías no notar ninguna diferencia. GPT-4o es eficiente, preciso y práctico en sus respuestas, y su poesía es completamente adecuada. No diría que quienes usan la versión gratuita se están perdiendo mucho al no tener acceso a GPT-4.5, al menos por ahora. Con el tiempo, eso podría cambiar, ya que GPT-4.5 aún es una vista previa de investigación y no está completamente disponible. Seguiré experimentando con ambos modelos para ver si hay tipos de solicitudes donde el nuevo modelo es definitivamente mejor, pero por ahora, diría que no te preocupes demasiado por cuál modelo usar, a menos que estés planeando una comida y no tengas mucho tiempo para prepararla.


