En la apertura del Google I/O 2024, los de Mountain View han anunciado importantes novedades relacionadas con Gemini. En primer lugar, vale mencionar el debut de Gemini 1.5 Flash, un modelo de inteligencia artificial liviano y optimizado para tareas que requieren de baja latencia y de bajo coste. Por su parte, Gemini 1.5 Pro ha duplicado su capacidad y ha ampliado su disponibilidad.
Según indicó Google, Gemini 1.5 Flash se ha pensado con la finalidad principal de implementarlo en chatbots o aplicaciones que requieran de extraer datos de documentos muy extensos. Su tamaño compacto permite que su ejecución a gran escala resulte más económica.
Gemini 1.5 Flash se ha desarrollado con el énfasis puesto en la velocidad y la eficiencia. Además, está preparada para el razonamiento multimodal —es decir, interpretando información a través de texto, audio e imágenes— y para trabajar con una ventana de contexto amplia. Los interesados podrán probarla desde hoy en Google Cloud a través de VertexAI y en Google AI Studio, en ambos casos con una ventana de contexto de hasta 1 millón de tokens.
Eso sí, de momento Google no ha especificado cuánto más pequeño es Gemini 1.5 Flash en comparación con su IA más potente. Los californianos indicaron que es “más liviano en comparación con Gemini 1.5 Pro”, pero sin detallar más.
Vale aclarar, de todos modos, que no se trata de un reemplazo de Gemini Nano, el modelo más eficiente que han desarrollado los de Mountain View y que se ha pensado para tareas on-device. De hecho, Gemini Nano ahora es multimodal, de modo que los usuarios podrán no solo usar texto como método de entrada, sino también imágenes, sonidos o la voz. La multimodalidad llegará a esta IA de la mano de los Pixel más adelante en el año.
Gemini 1.5 Pro lleva su ventana de contexto a 2 millones de tokens
En cuanto a Gemini 1.5 Pro, la IA más potente de Google recibirá hoy nuevas características, comenzando con una ventana de contexto todavía más amplia que la que ya poseía. Cuando la compañía anunció este modelo, tuvo como gran novedad la introducción de una ventana de contexto de 1 millón de tokens. Esto le permitía procesar sobre la marcha 1 hora de vídeo, 11 de horas de audio y bases de código con 30.000 líneas de código o más de 700.000 palabras.
Si creías que eso era impresionante, la compañía ha decidido incrementarla a 2 millones de tokens. Según explicó Sundar Pichai, CEO de Google, esta actualización es una pieza crucial para lograr el objetivo de llegar al “contexto infinito”. En principio, la ventana de contexto ampliada estará disponible en una vista previa privada para desarrolladores. Todavía no se ha mencionado cuándo se lanzará para todos.
Lo que sí se ha informado este martes es que Gemini 1.5 Pro con 1 millón de tokens de contexto estará disponible para todos los desarrolladores a nivel global. Pero no solo eso, puesto que esta versión mejorada de la IA también llega a partir de hoy a Gemini Advanced, la versión más potente del chatbot de Google, que ahora está disponible en 35 idiomas.
Ten en cuenta que Gemini Advanced es una herramienta de pago. Tiene un coste mensual de 19,99 dólares en Estados Unidos y 21,99 euros en Europa. En principio, esta herramienta utilizaba Gemini Ultra 1.0, pero se actualizará a la nueva versión de Gemini 1.5 Pro. Para sacar máximo provecho de la ventana de contexto de 1 millón de tokens, Google permitirá subir archivos directamente desde Drive a Gemini Advanced. La compañía sostiene que los documentos se mantendrán privados y que no se usarán para entrenar su IA.
Gemma 2 está en camino
Aprovechando el I/O 2024, Google ha anunciado novedades de Gemma, su IA de código abierto basada en Gemini. La compañía ha introducido PaliGemma, su primer modelo abierto de “lenguaje visual” destinado a tareas de etiquetado y subtitulado de imágenes. Los interesados pueden acceder a ella a través de Kaggle.
Pero Gemma también recibirá pronto una gran actualización con el lanzamiento de su segunda versión. La nueva generación del modelo tendrá 27.000 millones de parámetros y estará disponible a partir de junio. Según Google, Gemma 2 podrá superar en rendimiento a modelos que son dos veces más grandes.