Google amplió ayer el número de países donde el modelo multimodal Gemini Pro se integra con Bard, su asistente de inteligencia artificial. Pero también anunció la posibilidad de crear imágenes directamente en el chat, con resultados fotorrealistas.
La base es el motor Imagen 2, ahora integrado en Bard, ImageFX, Search y Vertex AI.. Pero por ahora nada de esto está disponible para los usuarios de Portugal.
Imagen 2 es un modelo de imágenes, un competidor de DALL.E de OpenAI que impulsa ChatGPT y Copilot de Microsoft.y produce imágenes fotorrealistas utilizando indicaciones bien específicas, lo que también le permite editar la imagen sin tener que repetir el proceso.
Vea algunas de las imágenes creadas con Imagen 2 y los mensajes utilizados
La calidad de las indicaciones del usuario marcará la diferencia en los resultados, pero la calidad de los detalles y la precisión del resultado pueden marcar la diferencia entre modelos entrenados con imágenes, estableciendo el vínculo entre el texto y la imagen creada. Rostros y manos son más reales y adaptados a una estética basada en las preferencias humanas, con encuadres, iluminación y detalles.
Las imágenes también se pueden editar durante el proceso, con modos de pintura interna y externa., que resultan útiles para agregar elementos. Algunas de estas funciones no estarán disponibles hasta finales de 2024.
Google tiene una API de Imagen en Google Cloud Vertex AI para que los desarrolladores exploren funciones. Y puedes saber más sobre esta plantilla de imágenes de Google con la documentación publicada sobre Vertex AI, que detalla su funcionamiento y sus posibilidades creativas.
«Explorador apasionado. Aficionado al alcohol. Fanático de Twitter. Webaholic galardonado. Aficionado a la comida. Geek de la cultura pop. Organizador».