La semana pasada, Google publicó un informe técnico sobre su modelo de inteligencia artificial más potente hasta ahora, Gemini 2.5 Pro. Este informe muestra los resultados de las evaluaciones de seguridad internas, pero los expertos opinan que carece de detalles importantes, lo que dificulta entender los riesgos que podría presentar el modelo. Los informes técnicos son útiles y a veces revelan información poco favorable que las empresas no siempre comparten abiertamente sobre su inteligencia artificial. En general, la comunidad de IA considera estos informes como esfuerzos de buena fe para apoyar la investigación independiente y las evaluaciones de seguridad.
Google tiene un enfoque diferente al de algunas de sus competidoras en cuanto a los informes de seguridad. Publica estos documentos solo cuando considera que un modelo ha pasado de la fase “experimental”. Además, no incluye todos los hallazgos de sus evaluaciones de “capacidades peligrosas” en estos informes, reservando esos resultados para auditorías separadas. Sin embargo, varios expertos expresaron su decepción por la escasez de información en el informe de Gemini 2.5 Pro, que no menciona el Marco de Seguridad Frontier (FSF) de Google, presentado el año pasado para identificar capacidades futuras de IA que podrían causar “daños severos”.
Peter Wildeford, cofundador del Instituto de Política y Estrategia de IA, comentó que el informe es muy escaso y llegó semanas después de que el modelo estuviera disponible para el público. Esto hace imposible verificar si Google está cumpliendo con sus compromisos públicos y, por lo tanto, evaluar la seguridad de sus modelos. Thomas Woodside, cofundador del Secure AI Project, también expresó su preocupación, señalando que aunque está contento de que Google haya publicado un informe para Gemini 2.5 Pro, no está convencido de que la empresa esté comprometida a proporcionar evaluaciones de seguridad de manera oportuna.
Google no ha publicado un informe para Gemini 2.5 Flash, un modelo más pequeño y eficiente anunciado la semana pasada. Un portavoz mencionó que un informe para Flash “vendrá pronto”. Woodside espera que Google comience a publicar actualizaciones más frecuentes, que incluyan resultados de evaluaciones para modelos que aún no se han desplegado públicamente, ya que estos también podrían representar riesgos serios.
Aunque Google fue uno de los primeros laboratorios de IA en proponer informes estandarizados, no es el único acusado de falta de transparencia. Meta también lanzó una evaluación de seguridad similarmente escasa para sus nuevos modelos Llama 4, y OpenAI decidió no publicar ningún informe para su serie GPT-4.1. Google tiene la responsabilidad de cumplir con las promesas que hizo a los reguladores sobre mantener altos estándares de pruebas y reportes de seguridad en IA. Hace dos años, Google aseguró al gobierno de EE. UU. que publicaría informes de seguridad para todos los modelos de IA “significativos” y ha hecho compromisos similares con otros países.
Kevin Bankston, asesor senior en gobernanza de IA en el Centro para la Democracia y la Tecnología, calificó la tendencia de informes esporádicos y vagos como una “carrera hacia el fondo” en la seguridad de la IA. Dijo que, junto con informes de laboratorios competidores como OpenAI, que han reducido su tiempo de pruebas de seguridad antes del lanzamiento, esta escasa documentación para el modelo de IA más avanzado de Google cuenta una historia preocupante sobre la falta de seguridad y transparencia en la carrera por llevar modelos al mercado. Google ha afirmado que, aunque no se detalla en sus informes técnicos, realiza pruebas de seguridad y “red teaming adversarial” para los modelos antes de su lanzamiento.


