Un nuevo estudio de la BBC revela que los chatbots de inteligencia artificial, como ChatGPT, no logran resumir las noticias de manera precisa. La investigación pidió a ChatGPT, Copilot, Gemini y Perplexity que resumieran 100 artículos de noticias de la BBC y evaluó la precisión de sus respuestas. Los resultados mostraron que el 51% de las respuestas de los chatbots presentaron “problemas significativos” y el 19% contenía errores factuales, como datos incorrectos, números y fechas.
El estudio destaca ejemplos de inexactitudes, como cuando Gemini afirmó incorrectamente que el NHS no recomendaba el vapeo como ayuda para dejar de fumar. Además, ChatGPT y Copilot indicaron que Rishi Sunak y Nicola Sturgeon aún estaban en el cargo, a pesar de que ya habían dejado sus puestos.
Otro hallazgo importante del informe es que la inteligencia artificial “tuvo dificultades para diferenciar entre opinión y hecho, editorializó y a menudo no incluyó el contexto esencial”. Estos resultados no son sorprendentes, ya que hemos visto problemas similares con herramientas de resumen de noticias, como los errores de Apple Intelligence que llevaron a la compañía a eliminar temporalmente esta función en iOS 18.3.
La BBC concluye que “Copilot de Microsoft y Gemini de Google presentaron más problemas significativos que ChatGPT de OpenAI y Perplexity”. Aunque esta investigación no aporta mucha información nueva, valida el escepticismo hacia las herramientas de resumen de IA y resalta la importancia de tomar la información de los chatbots con precaución.
La inteligencia artificial está avanzando rápidamente y los modelos de lenguaje grande (LLMs) se lanzan casi semanalmente, por lo que es de esperar que ocurran errores. Sin embargo, en mis pruebas personales, he notado que las inexactitudes y alucinaciones son menos frecuentes en programas como ChatGPT en comparación con hace unos meses.
Sam Altman, en una publicación de blog reciente, mencionó que la IA está progresando más rápido que la ley de Moore, lo que significa que seguiremos viendo mejoras constantes en el software y su interacción con el mundo. Por ahora, es mejor no confiar en la IA para obtener noticias diarias y, si se trata de tecnología, es recomendable seguir fuentes más confiables.


