Recientes investigaciones han revelado una tendencia preocupante en la inteligencia artificial: el problema de las “alucinaciones”, donde los modelos generan información falsa o engañosa, está empeorando. Pruebas internas de OpenAI han encontrado que sus modelos más recientes, incluyendo las versiones o3 y o4-mini, son más propensos a alucinar que las versiones anteriores. El modelo o3 inventa información en el 33% de las preguntas fácticas, mientras que la versión o4-mini lo hace en el 48%. Esta disminución en la fiabilidad representa una barrera significativa para las empresas que están considerando adoptar la IA, especialmente en industrias donde una decisión incorrecta puede tener enormes consecuencias financieras, legales o de reputación.
Por esta razón, las empresas deben considerar otras opciones que puedan ofrecer una solución adecuada. Pero primero, es importante entender por qué los modelos de lenguaje (LLMs) que se han vuelto tan populares alucinan tanto. El problema fundamental radica en cómo funcionan los LLMs como ChatGPT. Estos sistemas utilizan predicciones estadísticas para generar respuestas, haciendo esencialmente conjeturas educadas basadas en patrones en sus datos de entrenamiento. Como reconoció OpenAI, el cambio a modelos más avanzados como GPT-4o ha “aumentado involuntariamente lo que los usuarios perciben como ‘bluffing'”, que es cuando el software proporciona respuestas incorrectas con confianza sin admitir incertidumbre. Debido a que los LLMs utilizan estadísticas para determinar sus salidas, a veces generan respuestas incorrectas. Al igual que cuando alguien apuesta en una carrera de caballos, incluso considerando todas las variables, a veces (o frecuentemente) se equivocan. Cuando los LLMs hacen esto, lo llamamos “alucinación”.
El problema se agrava por los esfuerzos de los desarrolladores para hacer que la IA sea más parecida a los humanos. Los modelos modernos están programados con empatía, comprensión emocional y un deseo de complacer. Estas cualidades los hacen más atractivos, pero también más propensos a proporcionar respuestas que suenan seguras incluso cuando no están seguros. Es una tormenta perfecta: IA que suena autoritaria mientras es fundamentalmente poco fiable. Una reciente investigación de Sky News destacó este problema de manera dramática, revelando cómo ChatGPT fabricó transcripciones completas de un podcast real, insistiendo en su veracidad cuando se le cuestionó y solo admitiendo el error bajo presión sostenida.
La investigación confirma lo que muchos desarrolladores han sospechado: los modelos más nuevos están volviéndose menos fiables, no más. Para las empresas, estas alucinaciones representan una barrera insuperable para la adopción de la IA; en sectores como la salud, las finanzas, los servicios legales y los seguros, los errores tienen consecuencias reales. La actual tasa de error del 48% en algunos modelos hace que la supervisión humana sea obligatoria, lo que derrota gran parte del propósito de la IA como herramienta para aumentar la eficiencia. El desafío es particularmente agudo porque las alucinaciones son a menudo imperceptibles para los no expertos. Los LLMs pueden generar precedentes legales, consejos médicos o análisis financieros que suenan plausibles pero que son completamente fabricados. A diferencia de los errores humanos, que a menudo siguen patrones reconocibles, las alucinaciones de la IA pueden ser completamente aleatorias, lo que las hace casi imposibles de detectar sin experiencia en el tema. Esta imprevisibilidad se vuelve aún más preocupante dado lo rápido que se están implementando estos sistemas.
En medio de un aumento de la inversión empresarial en IA, las organizaciones están apresurándose a pasar de proyectos piloto a implementaciones a gran escala. Claramente, la motivación es adoptar rápidamente o arriesgarse a quedarse atrás. Pero en la carrera por integrar, ¿cuántas han considerado completamente los riesgos de las alucinaciones? Ya hemos visto consecuencias serias. Apple tuvo que revertir sus alertas de noticias generadas por IA, y Anthropic fue sorprendido citando referencias legales fabricadas en un documento judicial. A medida que la adopción se acelera, estos incidentes solo se multiplicarán. A su vez, veremos que la confianza en la IA se socava y las empresas se verán obligadas a hacerse una pregunta difícil: ¿hay un camino más fiable hacia adelante?
Una alternativa: IA neurosimbólica. Mientras la industria continúa invirtiendo recursos en LLMs, algunas empresas están adoptando un enfoque fundamentalmente diferente. En UnlikelyAI, hemos desarrollado lo que llamamos “IA neurosimbólica”, que es un sistema híbrido que combina redes neuronales tradicionales con razonamiento simbólico para aprovechar las fortalezas de cada uno. El razonamiento simbólico es un método antiguo y bien establecido para codificar conocimiento utilizando reglas lógicas claras. Representa hechos como piezas estáticas de conocimiento, lo que significa que el software no puede manipularlos o interpretarlos incorrectamente. Es la misma tecnología que permite los cálculos de hojas de cálculo que conocemos de Excel. La diferencia clave aquí es el determinismo. Mientras que los LLMs pueden dar respuestas diferentes a preguntas idénticas, los sistemas simbólicos siempre producen la misma salida para la misma entrada. Más importante aún, pueden admitir cuando no saben algo. Esa es una capacidad crucial en industrias reguladas que los LLMs carecen. Integrar ambos permite a los usuarios beneficiarse del uso fluido del lenguaje natural de los LLMs, así como de la fiabilidad del modelo simbólico.
El camino a seguir. La idea de que escalar modelos de lenguaje eventualmente eliminará las alucinaciones comienza a parecer cada vez más incierta. Estos modelos se basan en patrones estadísticos, no en una comprensión fundamentada, lo que significa que sus limitaciones pueden ser inherentes en lugar de temporales. En lugar de depender únicamente de más datos y modelos más grandes, puede ser hora de explorar caminos alternativos: enfoques que combinen el aprendizaje estadístico con formas de razonamiento más estructuradas. Para las empresas, las implicaciones son claras: aunque la IA tiene un enorme potencial, la generación actual de modelos no está lista para aplicaciones de alto riesgo. El futuro pertenece, en cambio, a enfoques híbridos que combinan la flexibilidad de las redes neuronales con la fiabilidad del razonamiento simbólico, ofreciendo lo mejor de ambos mundos sin el devastador costo de las alucinaciones generalizadas. Las soluciones para la IA empresarial ya están aquí. Solo requieren que superemos las limitaciones de los modelos actuales para adoptar enfoques que prioricen la fiabilidad junto con la capacidad. Para las empresas listas para realizar el potencial de la IA, el camino a seguir es claro: exigir transparencia, precisión y responsabilidad de los sistemas de IA que darán forma a la próxima década de innovación.


