¿Cuánto importan los modelos de base en inteligencia artificial? Aunque parezca una pregunta tonta, ha surgido en muchas conversaciones con startups de IA. Estas empresas ahora se sienten cómodas trabajando con negocios que antes se consideraban simples “envolturas de GPT”, es decir, aquellas que crean interfaces sobre modelos de IA existentes como ChatGPT. Actualmente, los equipos de startups se centran en personalizar modelos de IA para tareas específicas y en el diseño de interfaces, viendo el modelo de base como un recurso que se puede intercambiar según sea necesario.
Esto se evidenció en la reciente conferencia Boxworks, que se dedicó a software de cara al usuario construido sobre modelos de IA. Un factor que impulsa este cambio es que los beneficios de escalar mediante el preentrenamiento —el proceso inicial de enseñar a los modelos de IA usando grandes conjuntos de datos— se han desacelerado. Esto no significa que la IA haya dejado de avanzar, pero los beneficios iniciales de los modelos de base han comenzado a disminuir, y ahora se presta más atención al post-entrenamiento y al aprendizaje por refuerzo como fuentes de progreso futuro.
Si deseas crear una mejor herramienta de codificación de IA, es más efectivo trabajar en la afinación y el diseño de interfaces que gastar miles de millones en tiempo de servidor para el preentrenamiento. El éxito de Claude Code de Anthropic demuestra que las empresas de modelos de base también son competentes en estas áreas, aunque esta ventaja no es tan duradera como antes. En resumen, el panorama competitivo de la IA está cambiando, lo que debilita las ventajas de los laboratorios de IA más grandes. En lugar de una carrera por una IA general que supere las habilidades humanas en todas las tareas cognitivas, el futuro inmediato parece estar lleno de negocios específicos: desarrollo de software, gestión de datos empresariales, generación de imágenes, entre otros.
Aparte de una ventaja por ser los primeros en el mercado, no está claro que construir un modelo de base ofrezca alguna ventaja en estos negocios. Peor aún, la abundancia de alternativas de código abierto significa que los modelos de base pueden no tener poder de precio si pierden la competencia en la capa de aplicación. Esto podría convertir a empresas como OpenAI y Anthropic en proveedores de backend en un negocio de bajo margen, como dijo un fundador: “como vender granos de café a Starbucks”.
Este cambio sería dramático para el negocio de la IA. Durante el auge contemporáneo, el éxito de la IA ha estado intrínsecamente ligado al éxito de las empresas que construyen modelos de base, específicamente OpenAI, Anthropic y Google. Creer en la IA significaba pensar que su impacto transformador haría de estas empresas entidades generacionales. Podríamos discutir cuál empresa saldría ganando, pero estaba claro que alguna empresa de modelos de base tendría las llaves del reino. Durante años, el desarrollo de modelos de base fue el único negocio de IA que existía, y el rápido ritmo de progreso hacía que su liderazgo pareciera insuperable.
El año pasado complicó esta narrativa. Existen muchos servicios de IA de terceros exitosos que tienden a utilizar modelos de base de manera intercambiable. Para las startups, ya no importa si su producto se basa en GPT-5, Claude o Gemini; esperan poder cambiar de modelo en medio del lanzamiento sin que los usuarios finales noten la diferencia. Los modelos de base siguen avanzando, pero ya no parece plausible que una sola empresa mantenga una ventaja lo suficientemente grande como para dominar la industria.
Ya hay muchas indicaciones de que no hay una gran ventaja por ser el primero. Como señaló el capitalista de riesgo Martin Casado de a16z en un reciente podcast, OpenAI fue el primer laboratorio en lanzar un modelo de codificación, así como modelos generativos para imágenes y videos, solo para perder en las tres categorías ante competidores. “Hasta donde sabemos, no hay un foso inherente en la pila tecnológica de la IA”, concluyó Casado.
Por supuesto, no debemos descartar a las empresas de modelos de base todavía. Aún tienen muchas ventajas duraderas, como el reconocimiento de marca, infraestructura y enormes reservas de efectivo. El negocio de consumo de OpenAI puede resultar más difícil de replicar que su negocio de codificación, y pueden surgir otras ventajas a medida que el sector madure. Dado el rápido desarrollo de la IA, el interés actual en el post-entrenamiento podría revertirse en los próximos seis meses. Lo más incierto de todo es que la carrera hacia la inteligencia general podría dar lugar a nuevos avances en farmacéutica o ciencia de materiales, cambiando radicalmente nuestras ideas sobre lo que hace valiosos a los modelos de IA. Pero, mientras tanto, la estrategia de construir modelos de base cada vez más grandes parece menos atractiva que el año pasado, y el gasto de miles de millones de Meta comienza a parecer arriesgado.


