Esta semana, el lanzamiento de Gemini de Google aprovechó el potencial de los modelos multimodalesdonde la información de entrada puede ser video, imágenes, código o audio, comprendiendo el contexto y produciendo una respuesta a las indicaciones del usuario.
Google afirma que este es el modelo de IA generativa más potente y estará disponible en tres modelos: Ultra, Pro y Nano. Las versiones más avanzadas no estarán disponibles hasta el próximo año, pero ya es posible aprovechar ciertas funciones. Por ahora todavía en modo limitado, sólo en texto, y sólo en inglés.
El modelo Gemini Pro está integrado con el chatbot Bard y se puede acceder a él a través del sitio web en bard.google.com. Debe tener acceso a una cuenta de Google e iniciar sesión, ya que no es posible hacerlo en modo anónimo.
En el futuro, el El objetivo es que Bard también integre capacidades multimodales, con conexión a diferentes aplicaciones de Google, como Gmail o Youtube, entre otras.. Este es uno de los principales diferenciadores respecto a otros modelos, como ChatGPT o GPT 4 de OpenAI, o incluso Copilot y Bing de Microsoft.
Google promete añadir Gemini a Bard en otros idiomas pronto, pero sin dar fechas. La versión más potente de Gemini, Ultra, debería estar disponible en 2024 y todo indica que se podrá utilizar en una versión “optimizada” de Bard, Bard Advanced.
Mire el vídeo de descripción general de Géminis de Google
«Explorador apasionado. Aficionado al alcohol. Fanático de Twitter. Webaholic galardonado. Aficionado a la comida. Geek de la cultura pop. Organizador».