Google lance Nano Banana 2 Lite et ouvre Gemini Omni Flash aux développeurs

La firme complète sa gamme Nano Banana avec une version rapide et économique, tout en élargissant le déploiement de son modèle de génération de vidéos.

Google continue d'investir dans les modèles de génération d'images et de vidéos. © Google

Dans un billet de blog publié ce mardi 30 juin 2026, Google annonce la sortie de Nano Banana 2 Lite, une nouvelle déclinaison de son modèle de génération d’images déployé en février dernier, dépeinte comme nettement plus rapide et plus économique que les autres versions de la gamme. En parallèle, la firme a rendu accessible aux développeurs Gemini Omni Flash, son modèle multimodal « de haute qualité et économique » pour la génération et l’édition vidéo, dévoilé en mai lors de sa conférence annuelle.

Nano Banana 2 Lite, une version taillée pour la vitesse et le volume

Disponible dans Google AI Studio depuis ce mardi, Nano Banana Lite 2 est conçu pour « l’idéation rapide et les pipelines de développement à haute fréquence, où la vitesse et le coût comptent plus que la qualité maximale », détaille la firme dans son communiqué. La firme invite les développeurs encore sur la première version de Nano Banana, son modèle historique, à migrer vers ce nouveau modèle, jugé plus performant sur tous les points. Nano Banana 2 Lite se distingue sur la latence et son faible coût : il produit des images à partir de texte en 4 secondes, « un atout pour le prototypage interactif et l’ébauche visuelle rapide », et facture 0,034 dollar les 1 000 images. La firme affirme, benchmarks à l’appui, que le modèle produit des résultats fidèles aux prompts, avec des personnages cohérents et un rendu de texte lisible.

Nano Banana : quel modèle choisir selon son usage ?

Nano Banana 2 Lite : une version optimisée pour les workflows à très faible latence et à fort volume.
Nano Banana 2 : un modèle « généraliste et polyvalent » qui combine qualité et rapidité.
Nano Banana Pro : une version « optimisée pour les cas d’usage complexes et professionnels », offrant davantage de contrôle et capable d’une réflexion approfondie.
Nano Banana : un « modèle historique », que Google conseille d’abandonner au profit de Nano Banana 2 Lite.

La firme ne réserve pas Nano Banana 2 Lite à Google AI Studio. Il est également déployé sur plusieurs services de la firme, comme l’application Gemini, NotebookLM, Google Photos et Google Ads.

Cette accélération intervient alors que Google reste toujours à la traîne face à OpenAI sur le terrain de la génération d’images. Selon le classement de juin de la Text-to-Image Arena d’Artificial Analysis, GPT Image 2 et GPT Image 1.5 affichent des performances bien supérieures à celles de Nano Banana 2 et Nano Banana Pro.

nano-banana-2-lite-vitesse-generation — Avec cette version, la production de contenus peut se faire à grande échelle. © Google

Gemini Omni Flash, la vidéo conversationnelle ouverte aux développeurs

Présenté en mai dernier lors de la conférence Google I/O, Gemini Omni Flash associe « le raisonnement multimodal de Gemini à la génération et au montage vidéo », resitue Google. Déjà déployé auprès des abonnés Google AI Plus, Pro et Ultra, il rejoint désormais l’API Gemini et Google AI Studio en préversion publique.

Le modèle se distingue par plusieurs atouts :

Une approche conversationnelle du montage vidéo : il est possible, avec plusieurs instructions successives, d’affiner et modifier finement les vidéos produites par Gemini Omni Flash.
Un référencement multimodal : le modèle est capable de « combiner des entrées comme des images, du texte et de la vidéo » pour générer des scènes cohérentes.
Une connaissance approfondie du monde réel : selon Google, Gemini Omni Flash s’appuie sur les connaissances de Gemini, notamment en histoire ou en biologie, pour générer des « vidéos convaincantes ».

Facturé 0,10 dollar par seconde de génération, un tarif « identique à celui de Veo 3.1 Fast », détaille la firme, Gemini Omni Flash reste toutefois limité sur plusieurs points : les vidéos générées sont, pour l’instant, plafonnées à dix secondes, l’import de fichiers audios et « l’extension de scène » ne sont pas encore pris en charge par l’API, et les imports de séquences utilisées pour références, supérieures à 3 secondes, ne sont pas non plus bien traitées par le modèle à ce stade. « La cohérence des personnages présente encore certaines limites lors des changements de scène ou des mouvements de panoramique, mais nous travaillons à l’améliorer », complète Google.

Sujets liés :