Google lance Gemini 2.5 Flash Image, un modèle qui permet d’impressionnantes retouches IA

Google a revendiqué la paternité de nano-banana, qui dominait les classements des modèles de génération d’images depuis plusieurs jours. Parce qu’il semble exceller dans la retouche visuelle.

nano-banana-gemini-2-5-flash-image
Disponible sur l'application Gemini, ce modèle est signé Google DeepMind. © Nina - stock.adobe.com

Après avoir longtemps accusé un retard dans ce domaine, Google franchit une étape dans la génération d’images. Ce mardi 26 août 2025, l’entreprise californienne a officiellement présenté Gemini 2.5 Flash Image, un modèle d’abord conçu pour offrir davantage de contrôle aux utilisateurs en matière de retouche visuelle, « en accordant une attention particulière au maintien de la ressemblance d’un personnage d’une image à l’autre », un défaut récurrent chez ses concurrents. Son déploiement mondial a débuté sur l’application Gemini, l’API Gemini, Google AI Studio et Vertex AI, précise la firme dans un communiqué.

Un modèle qui dominait déjà le classement de LMArena avant son lancement

Développé par Google DeepMind, ce modèle faisait l’objet de spéculations ces derniers jours, après avoir été discrètement mis en ligne sous le nom nano-banana – son surnom en interne – sur la plateforme LMArena, utilisée pour évaluer objectivement les performances des modèles grâce aux contributions des utilisateurs. Très performant, il s’était rapidement hissé en tête dans les catégories Image Edit et Text-to-image, devançant notamment 4o Image Generation, la technologie intégrée à ChatGPT depuis mars dernier.

Pour afficher ce contenu issu des réseaux sociaux, vous devez accepter les cookies et traceurs publicitaires.

Ces cookies et traceurs permettent à nos partenaires de vous proposer des publicités et des contenus personnalisés en fonction de votre navigation, de votre profil et de vos centres d’intérêt.Plus d’infos.

Accepter

Gemini 2.5 Flash Image effectue des retouches sans altérer la qualité

La spécificité de cette technologie qui n’est pas destinée à remplacer Imagen – l’autre famille de modèles de générations d’images de Google – réside dans sa capacité à créer de nouveaux éléments ou à modifier ceux existants sans détériorer la qualité visuelle ni forcément donner l’impression d’une image générée par IA. « Nous faisons vraiment progresser la qualité visuelle, ainsi que la capacité du modèle à suivre les instructions », estime Nicole Brichtova, product lead chez Google DeepMind, dans les colonnes de TechCrunch.

Avec Gemini 2.5 Flash Image, il devient possible de combiner plusieurs photos pour « créer une toute nouvelle scène », de changer la tenue d’une personne ou de la placer dans un décor différent tout en conservant son apparence ou de « modifier des parties spécifiques d’une image tout en préservant le reste », illustre Google dans son blog post. Et tout cela à partir d’un simple prompt. Comme le montre l’exemple ci-dessous, fourni par l’entreprise, le modèle peut ajouter un canapé, une bibliothèque, un tapis ou changer la peinture d’une pièce vide sans altérer la photo d’origine. Et avec un rendu, il faut le dire, assez bluffant.

Nous savons que, lorsqu’il s’agit d’éditer des photos de vous-même ou de personnes que vous connaissez, les défauts comptent — une représentation « proche mais pas tout à fait identique » ne fonctionne pas, déclare Google.

Google indique que, pour prévenir les abus, chaque image créée ou modifiée dans l’application Gemini inclut un watermark « AI » visible « ainsi [qu’un] filigrane numérique invisible SynthID, afin d’indiquer clairement qu’elles ont été générées par IA ».

Comment tester Gemini 2.5 Flash Image ?

Encore indisponible au moment de la rédaction de cet article, ce « modèle de pointe » est, depuis ce mardi, déployé progressivement dans l’application Gemini, précise Google. Il sera accessible aux utilisateurs gratuits comme payants, probablement avec certaines restrictions. L’utilisateur pourra simplement ajouter une ou plusieurs images accompagnées d’un prompt pour lancer la génération ou la retouche.

Sujets liés :
Publier un commentaire
Ajouter un commentaire

Votre adresse email ne sera pas publiée.

Les meilleurs outils pour les professionnels du web