Google ha lanzado un nuevo modelo experimental llamado Gemini Embedding, que forma parte de su API para desarrolladores Gemini. Este modelo se encarga de convertir palabras y frases en representaciones numéricas, conocidas como “embeddings”, que capturan el significado del texto. Los embeddings son útiles en diversas aplicaciones, como la recuperación y clasificación de documentos, ya que pueden reducir costos y mejorar la velocidad de procesamiento.
Varias empresas, como Amazon, Cohere y OpenAI, también ofrecen modelos de embeddings a través de sus APIs. Aunque Google ya contaba con modelos de embeddings, Gemini Embedding es el primero que ha sido entrenado utilizando la familia de modelos de inteligencia artificial Gemini.
Según Google, este nuevo modelo ha heredado la comprensión del lenguaje y el contexto matizado de Gemini, lo que lo hace aplicable en una amplia variedad de áreas, incluyendo finanzas, ciencia, derecho y búsqueda. La compañía afirma que Gemini Embedding supera el rendimiento de su modelo anterior, text-embedding-004, y logra resultados competitivos en pruebas de referencia populares. Además, este nuevo modelo puede procesar textos y códigos más largos y admite el doble de idiomas, superando los 100.
Es importante destacar que Gemini Embedding se encuentra en una “fase experimental” con capacidad limitada y está sujeto a cambios. Google ha indicado que está trabajando para ofrecer una versión estable y disponible para todos en los próximos meses.


