World
Google presenta Gemini 2.0 Flash: un gran salto en el rendimiento de la IA y la multimodalidad
Google ha anunciado el lanzamiento de Gemini 2.0 Flash, una actualización significativa de su familia de modelos Gemini, que marca una nueva era en las capacidades de IA. Este último modelo está diseñado para ofrecer mejoras sustanciales en velocidad, rendimiento y capacidades multimodales, basándose en el éxito de su predecesor, Gemini 1.5 Flash.
Gemini 2.0 Flash es dos veces más rápido que el modelo anterior Gemini 1.5 Pro y mantiene los rápidos tiempos de respuesta que hicieron que las versiones anteriores fueran populares entre los desarrolladores. El nuevo modelo admite salidas de texto, imágenes y audio en tiempo real, lo que mejora su versatilidad para diversas aplicaciones.
Una característica clave de Gemini 2.0 Flash es la API Multimodal Live, que permite a los desarrolladores crear aplicaciones dinámicas con transmisión de audio y video en tiempo real. Esta API admite patrones de conversación naturales, incluidas interrupciones y detección de actividad de voz, lo que la hace ideal para aplicaciones que requieren experiencias de usuario interactivas e inmersivas.
El modelo también introduce integraciones de herramientas nativas, lo que le permite realizar tareas como ejecución de código, consultas de Búsqueda de Google y funciones personalizadas definidas por el usuario. Esta capacidad mejora la capacidad del modelo para proporcionar respuestas objetivas y completas al aprovechar la Búsqueda de Google de forma nativa y ejecutar múltiples búsquedas en paralelo.
Además de estas características, Gemini 2.0 Flash incluye salida de audio nativa multimodal, lo que permite salidas de voz orientables de alta calidad en múltiples idiomas con acentos personalizables. También admite salida de imágenes en línea nativa, lo que permite una combinación perfecta de texto e imágenes para diversas aplicaciones.
Google también está ampliando las capacidades del Proyecto Astra con Gemini 2.0, introduciendo un nuevo agente llamado Project Mariner que puede navegar por la web en nombre del usuario. Estos proyectos se encuentran en las primeras etapas de desarrollo pero ya están siendo probados por usuarios confiables.
Los desarrolladores pueden acceder a Gemini 2.0 Flash a través de la API Gemini en Google AI Studio y Vertex AI durante su fase experimental, y se espera que esté disponible de forma general en enero. El modelo también se integrará en varias plataformas de Google, como Android Studio, Chrome DevTools y Firebase, en los próximos meses.