Après ChatGPT, Google Bard devient aussi un générateur d’images par IA
Google a annoncé l’intégration de son modèle Gemini Pro dans Bard partout dans le monde, ainsi qu’une fonctionnalité pour générer des images grâce à Imagen 2.
La génération d’images et Gemini Pro arrivent dans Google Bard
Depuis plusieurs mois, Google tente de faire son retard sur ses concurrents dans le domaine de l’IA générative. Son chatbot, Bard, peine à se démarquer face aux poids lourds que sont ChatGPT et Microsoft Copilot, tous deux alimentés par GPT-4 dans leur version optimale. En décembre 2023, Google annonçait la disponibilité de Gemini, son dernier modèle de langage, proposé en trois versions entraînées pour des tâches spécifiques : Ultra, Pro et Nano.
Début février 2024, Google a mis à disposition Gemini Pro au sein de Bard « dans plus de 40 langues et 230 pays et territoires », explique la firme dans un blog post, pour que l’agent conversationnel puisse répondre avec plus de précision et de pertinence aux requêtes des utilisateurs. Parallèlement, Google Bard est doté de nouvelles capacités, dont la génération d’images grâce au modèle Imagen 2, afin de concurrencer ChatGPT (dans ses versions payantes) et Microsoft Copilot qui proposent déjà cette fonctionnalité grâce à DALL-E.
Comment générer des images avec Google Bard
Google assure que « vous pouvez désormais générer gratuitement des images dans Bard en anglais dans la plupart des pays du monde » avec Imagen 2, « conçu pour équilibrer performance et vitesse, offrant des sorties photoréalistes de haute qualité ». Cependant, il est possible que le déploiement de la fonctionnalité prenne quelques jours. En effet, nous n’avons pas encore pu tester l’outil, Bard nous précisant qu’il n’a pas encore cette capacité dans son panel de tâches.
Voici un aperçu vidéo de la fonctionnalité proposé par Google :
Néanmoins, la marche à suivre pour tester la génération d’images dans Bard est très simple. Il vous faut vous rendre dans un premier temps sur l’interface du chatbot en suivant ce lien. Puis, une fois que l’agent conversationnel est accessible, il vous suffit d’entrer une requête comme vous le feriez pour générer une image sur un outil similaire. Rédigez votre prompt et Bard créera le visuel souhaité, en vous proposant quatre versions différentes.
D’autres outils d’IA déployés… mais pas en France
Parallèlement à l’intégration de Gemini Pro et de la génération d’images au sein de son IA conversationnelle, Google a également annoncé la mise en place de nouveaux outils, ou de versions plus performantes d’outils existants, avec ImageFX, MusicFX et TextFX. Disponibles dans Google Labs et seulement aux États-Unis, en Nouvelle-Zélande, au Kenya et en Australie pour le moment, ils permettent, comme leur nom l’évoque, de générer des images, de la musique et du texte grâce à l’IA.
Nouvel outil, ImageFX fonctionne de la même façon que la génération d’images, grâce au text-to-image. Il permet de créer des visuels à l’aide d’un prompt, mais propose également des « puces expressives » pour vous aider à choisir, par exemple, le style artistique de votre image. Pour MusicFX et TextFX, il s’agit d’améliorations de modèles existants. Mais aucune information n’est donnée pour une éventuelle disponibilité en France et en Europe dans les semaines ou mois à venir.
Community managers : découvrez les résultats de notre enquête 2025
Réseaux, missions, salaire... Un webinar pour tout savoir sur les CM, lundi 29 septembre à 11h !
Je m'inscris