OpenAI ha lanzado GPT-4.1 para ChatGPT, y aunque fue una presentación discreta, representa una mejora notable, especialmente en razonamiento lógico y programación. Este modelo tiene una gran capacidad para entender contextos y pensar de manera estructurada, lo que podría facilitar la programación y la resolución de acertijos. Sin embargo, OpenAI tiende a hablar de las habilidades de codificación de sus modelos de una manera que puede resultar tediosa para quienes no son expertos en tecnología.
Decidí explorar cómo GPT-4.1 se desempeñaría en acertijos lógicos y no solo en programación. Para ello, lo comparé con otros modelos de ChatGPT: GPT-4o, que es el modelo predeterminado para todos los usuarios, y o3, un modelo diseñado para resolver problemas matemáticos y lógicos de manera eficiente. Aunque este “Campeonato de Lógica” no es un experimento científico, puede dar una idea de cómo se comparan los modelos.
Empecé con un acertijo de razonamiento deductivo sobre un gato escondido en cajas. Los modelos debían encontrar al gato que salta a una caja adyacente cada noche, y solo se puede abrir una caja cada mañana. GPT-4.1 propuso una estrategia clara y efectiva, simulando los movimientos del gato y explicando cómo la probabilidad de encontrarlo se convierte en certeza. El modelo o3 tardó 22 segundos en llegar a una respuesta similar, aunque su explicación fue más extensa. Por su parte, GPT-4o fue breve y directo, mencionando una “estrategia de persecución”.
Luego, planteé un acertijo sobre un barril de vino. La mujer decía que estaba más de la mitad lleno, mientras que el hombre decía que no. GPT-4.1 explicó que se debe inclinar el barril para ver si el vino toca el borde; si se ve el fondo, está menos de la mitad lleno. El modelo o3 fue más conciso, usando solo unos pocos puntos para explicar la solución. GPT-4o ofreció una respuesta intermedia, con algunos puntos y una explicación más detallada sobre la física del problema.
Finalmente, presenté un acertijo de juego de palabras: “¿Qué ocurre una vez en un minuto, dos veces en un momento y nunca en mil años?” GPT-4.1 respondió rápidamente, identificando que la letra M es la clave. El modelo o3 también lo resolvió, pero con menos detalles, mientras que GPT-4o proporcionó una breve explicación sobre la interpretación del acertijo.
Después de interactuar con estos modelos sobre gatos, vino y palabras, puedo concluir que todos tienen un buen manejo de la lógica. Aunque sus respuestas varían en detalle, comprenden bien los mecanismos detrás de los acertijos. GPT-4.1 se destaca por su claridad y capacidad de explicación, lo que lo convierte en una buena opción para resolver problemas lógicos, incluyendo la programación. Sin embargo, si buscas ayuda con acertijos, cualquiera de los modelos puede ser útil, y es posible que no notes una gran diferencia entre ellos.


