Google Gemini 2.0

Google ha anunciado el lanzamiento de Gemini 2.0, la nueva generación de su modelo de inteligencia artificial, con mejortas centradas en los avances en multimodalidad, como la salida nativa dei mágenes y audio o el uso nativo de herramientas que permitirán construir nuevas experiencias de agentes de IA que pueden planificar, recordar y actuar por nosotros con nuestras indicaciones.

El primer modelo de esta nueva familia, bajo el nombre de Gemini 2.0 Flash, con su baja latencia y rendimiento mejorado, ya está disponible tanto para desarrolladores (vía API en Google AI Studio y Vertex AI) como para usuarios finales en versión experimental tanto en la web de escritorio y móvil (pronto en la aplicación), seleccionándola desde el menú desplegable.

Los usuarios de Gemini Advanced tendrán también acceso a la nueva función Deep Research, que utiliza capacidades avanzadas de razonamiento y contexto largo como si fuera un asistente de investigación, explorando temas complejos y creando informes.

También se están incorporando las capacidades de razonamiento avanzado de Gemini 2.0 a Vistas Creadas con IA para para abordar temas más complejos y responder preguntas de varios pasos, entre ellas ecuaciones matemáticas avanzadas, consultas multimodales y  programación.

Además, se están realizando avances en las experiencias con agentes de IA que nos ayudarán a realizar diferentes tareas gracias al trabajo conjunto de las capacidades de acción de la interfaz de usuario nativa de Gemini 2.0 Flash, junto con otras mejoras como el razonamiento multimodal, la comprensión de contextos largos, el seguimiento y la planificación de instrucciones complejas, la llamada a funciones compuestas, el uso de herramientas nativas y la mejora de la latencia.

Ahora mismo se están testeando diferentes prototipos y experimentos de investigación:

  • Agentes con razonamiento multimodal: El Proyecto Astra, un prototipo de investigación que explora las capacidades de un asistente universal de IA, ha mejorado con la versión 2.0 y ya está disponible para un grupo de probadores de confianza.
  • Agentes que ayudan a realizar tareas complejas: Proyecto Mariner, primer prototipo de investigación diseñado con Gemini 2.0 que explora el futuro de la interacción entre humanos y agentes, empezando por su navegador, también está disponible para un grupo limitado de probadores de confianza.
  • Agentes para desarrolladores: Jules es un agente de código experimental impulsado por IA que se integra directamente en un flujo de trabajo de GitHub. Ya está disponible para probadores de confianza.
  • Agentes aplicados a distintos ámbitos: Agentes con Gemini 2.0 que pueden ayudarnos a navegar por el mundo virtual de los videojuegos, y agentes que pueden ayudarnos en el mundo físico aplicando las capacidades de razonamiento espacial de Gemini 2.0 a la robótica.

Más información en la web oficial de Google.