Los grandes modelos de lenguaje (LLMs), como ChatGPT, han sorprendido al mundo con sus habilidades. Sin embargo, también han sido noticia por generar información incorrecta con mucha confianza. Este fenómeno, conocido como “alucinación”, puede ir desde errores inofensivos, como contar mal las letras ‘r’ en “fresa”, hasta casos legales completamente inventados que han metido en problemas a abogados. Es cierto que se podría argumentar que todos deberían verificar rigurosamente cualquier cosa que sugiera la inteligencia artificial (IA), y estoy de acuerdo. Pero a medida que estas herramientas se integran más en nuestro trabajo, investigación y toma de decisiones, necesitamos entender por qué ocurren estas alucinaciones y si podemos prevenirlas.
Para comprender por qué la IA alucina, es útil recordar cómo funcionan los LLMs. Estos modelos no recuperan hechos como lo haría un motor de búsqueda o una persona buscando en una base de datos. En cambio, generan texto haciendo predicciones. “Los LLMs son, en esencia, predictores de la siguiente palabra y soñadores”, dice la ingeniera de software Maitreyi Chatterjee. “Generan texto prediciendo la palabra que estadísticamente es más probable que venga a continuación”. A menudo asumimos que estos modelos están pensando o razonando, pero en realidad son sofisticados predictores de patrones, y este proceso inevitablemente conduce a errores.
Esto explica por qué los LLMs tienen dificultades con cosas aparentemente simples, como contar las ‘r’ en “fresa” o resolver problemas matemáticos básicos. No están procesando la información como lo haríamos nosotros. Otra razón clave es que no verifican lo que producen. “Los LLMs carecen de un mecanismo interno de verificación de hechos, y dado que su objetivo es predecir el siguiente token [unidad de texto], a veces prefieren secuencias de tokens que suenan coherentes en lugar de correctas”, explica Chatterjee. Y cuando no saben la respuesta, a menudo inventan algo. “Si los datos de entrenamiento del modelo tienen información incompleta, contradictoria o insuficiente para una consulta dada, podría generar información plausible pero incorrecta para ‘llenar’ los vacíos”, añade.
En lugar de admitir incertidumbre, muchas herramientas de IA tienden a producir una respuesta, ya sea correcta o no. Otras veces, tienen la información correcta pero no la recuperan o aplican adecuadamente. Esto puede suceder cuando una pregunta es compleja o el modelo malinterpreta el contexto. Por eso, la forma en que formulamos las preguntas es importante.
El poder de los prompts para evitar alucinaciones
Ciertos tipos de prompts pueden hacer que las alucinaciones sean más probables. Ya hemos compartido nuestros mejores consejos para mejorar tus prompts de IA, no solo para obtener resultados más útiles, sino también para reducir las posibilidades de que la IA se desvíe. Por ejemplo, los prompts ambiguos pueden causar confusión, llevando al modelo a mezclar fuentes de conocimiento. Chatterjee menciona que aquí es donde hay que tener cuidado; si preguntas “Háblame de París” sin contexto, podrías obtener una mezcla extraña de hechos sobre París, Francia, Paris Hilton y París de la mitología griega.
Pero más detalles no siempre son mejores. Los prompts excesivamente largos pueden abrumar al modelo, haciendo que pierda de vista detalles clave y comience a llenar vacíos con invenciones. De manera similar, cuando un modelo no tiene suficiente tiempo para procesar una pregunta, es más probable que cometa errores. Por eso, técnicas como el “chain-of-thought prompting”, donde se anima al modelo a razonar paso a paso, pueden llevar a respuestas más precisas.
Proporcionar una referencia es otra forma efectiva de mantener a la IA en el camino correcto. “A veces puedes resolver este problema dando al modelo una ‘prelectura’ o una fuente de conocimiento a la que referirse para que pueda verificar su respuesta”, explica Chatterjee. El “few-shot prompting”, donde se le da al modelo una serie de ejemplos antes de responder, también puede mejorar la precisión.
A pesar de estas técnicas, las alucinaciones siguen siendo un desafío inherente para los LLMs. A medida que la IA evoluciona, los investigadores están trabajando en formas de hacer que los modelos sean más confiables. Pero por ahora, entender por qué la IA alucina, cómo prevenirlo y, lo más importante, por qué deberías verificar todo es esencial.


