En 2025, la generación de imágenes a través de IA ha dejado de ser un concepto novedoso... pero la tecnología sigue avanzando a pasos agigantados. Y
Google ha sabido convertirse en protagonista de uno (o varios) de estos pasos con la presentación de
Gemini Flash 2,0, una herramienta que cambia las reglas del juego en lo que respecta a la edición de imágenes.
A pesar de que existen otros productos en el mercado que ya ofrecen resultados impresionantes (MidJourney, Flux, etc.), lo que distingue a
Gemini Flash 2,0 es su versatilidad, mucho más allá de la mera generación.
Y es que, en un panorama donde la mayoría de las herramientas de generación de imágenes están centradas en la creación de las mismas desde cero a partir de un texto (o 'prompt'), el modelo
Gemini Flash 2,0 de
Google constituye un hito al ofrecer una función multimodal de forma nativa.
¿Qué significa esto? Que este sistema no solo puede generar imágenes a partir de descripciones textuales, sino que además es capaz de recibir imágenes externas como entrada para luego editarlas o combinarlas, lo que añade una capa de complejidad y creatividad sin precedentes.
Si bien OpenAI presentó un 'paper académico' con un concepto similar como función de GPT-4o, nunca habilitó el acceso público a la misma (teniéndonos que contentar con el, en comparación, limitadísimo uso del 'pincel' de DALL-E 3).