Pourquoi l’IA impose des images stéréotypées, et comment s’en affranchir

Expert en création digitale, Patrick Bellair nous dévoile sa méthode et ses conseils pour concevoir des visuels originaux, loin des stéréotypes que peuvent produire les générateurs d’images par IA.

AI Image Generator Platform Interface with Colorful Art Thumbnails Elide
Les générateurs d'images par IA proposent des résultats populaires, basés sur les likes des utilisateurs. © InfiniteFlow - stock.adobe.com

Pour quelle(s) raison(s) les images générées par des solutions IA se ressemblent-elles autant ? Quelle méthode faut-il suivre pour sortir de ce cliché, et parvenir à concevoir des visuels qui se démarquent ? Comment réussir à encadrer les générateurs d’images par IA, et en quoi la culture artistique reste une clé essentielle afin de créer des images uniques ? Pour mieux comprendre l’origine de cette idée reçue, et connaître les meilleures pratiques à suivre, nous avons interrogé l’expert en création digitale Patrick Bellair.

Picture of Patrick Bellair

Patrick Bellair, CEO de La Dictature du Beau, photographe professionnel et formateur

Patrick Bellair dirige La Dictature du Beau, une agence de communication digitale, dont l’objectif est de faire briller ses clients sur le digital, à travers du branding, des sites web, des campagnes marketing, de la communication… En marge de cette activité, il est photographe professionnel dans la beauté. Sa 3e casquette consiste à animer des conférences et des formations sur l’IA. « Ce qui est intéressant, c’est que, dans ces 3 aspects de ma carrière, l’IA a complètement changé la manière dont j’exerce ces métiers. »

Avec l’essor de l’IA, on constate que toutes les images générées ont tendance à se ressembler. En tant qu’expert en création digitale, quel est votre point de vue sur cette idée reçue ?

De manière générale, je dirais que les personnes qui utilisent ces outils ont la flemme. Ils ne vont pas prendre le temps d’apprendre de nouvelles compétences, et vont faire la plupart du temps des prompts qui ne sont pas du tout adaptés. Par exemple, si je mets juste « crée un chien », je vais obtenir un résultat générique et très pauvre en termes de description.

Il faut bien garder en tête que, partout où il n’y aura aucune description, l’IA va prendre la main. Cela signifie que, si je ne lui précise pas quel genre de chien je veux, que je n’indique pas de contexte, ni de style – si le rendu doit être une photo, une image cinématographique, un portrait ou un dessin, etc. -, c’est l’IA qui va décider tout cela à ma place. L’objectif des IA consiste à nous assister au mieux, et à nous faire plaisir. C’est pour cela que, quand on utilise ChatGPT ou Meta AI par exemple, on a souvent des réponses qui vont dans notre sens.

Partout où l’on ne va pas lui fournir de description, par défaut, l’outil IA va créer les images les plus populaires possibles, qui vont plaire au plus grand nombre.

C’est la raison pour laquelle on va obtenir des résultats qui peuvent être relativement identiques. Ce ne sera jamais complètement similaire, mais il peut y avoir une certaine esthétique appliquée plus souvent que d’autres, avoir un genre de pattern qui fait que certaines images risquent de se ressembler, puisque ce seront celles qui auront obtenu le plus de likes.

Que recommandez-vous aux experts en création digitale pour lutter justement contre cette uniformité ?

Il faut cadrer le plus possible l’outil IA que l’on utilise. Attention : la méthode pour créer un bon prompt pour une image va être différente de celle à utiliser pour générer un texte par IA. Pour un prompt texte, on va donner un rôle à l’IA, lui expliquer ce qu’on attend, lui donner un contexte, un style et des éléments.

Au contraire, quand on veut créer une image, on va être extrêmement descriptif.

On ne va pas lui dire « fais comme un expert de la peinture », mais directement : « crée une peinture », avec le plus de détails possible. Parce que même dans la peinture, on va avoir différents formats : l’aquarelle, la peinture à l’huile, la peinture au couteau… Avec ce genre d’indications, déjà, on va être beaucoup plus dans une perspective descriptive.

Autre exemple : si je souhaite générer une image cinématographique, je vais préciser dans mon prompt « dans un style cinéma, crée un portrait close-up d’une femme qui a tel âge, etc. ». Il faut toujours essayer d’être le plus précis.

Comment optimiser son prompt afin d’obtenir une image originale, qui se distingue des autres ? Quelles sont vos bonnes pratiques ?

Je conseille de demander un coup de main à une IA générative de texte. Par exemple, vous pouvez demander à ChatGPT d’agir comme un spécialiste des générateurs d’images par IA, puis de décrire l’image que vous souhaitez. Ensuite, vous lui demandez de générer 4 prompts optimisés pour Midjourney, en anglais. De cette manière, vous laissez un peu de créativité à l’IA, pour qu’elle génère des images encore plus intéressantes.

Les IA génératives d’images, comparées aux IA génératives de texte, ressemblent plus à des adolescents surdoués. Surdoués, dans le sens où les images générées vont être incroyables. Personnellement, je préfère utiliser Midjourney, mais il y en a plein d’autres : DALL-E, Stable Diffusion… Mais elles restent encore au stade de l’adolescent, qui ne va écouter qu’à moitié ce qu’on lui dit.

Pour les prompts, c’est la même chose : plus il sera long, et plus l’IA risque de décrocher en route.

En d’autres termes, si votre prompt n’est pas assez précis, vous obtiendrez que des images génériques. Si, à l’inverse, il est trop long et trop précis, l’IA ne respectera pas certains éléments demandés. Avec le temps, cela tend à s’améliorer. C’est d’ailleurs ce qui rend le sujet si passionnant !

À partir de votre expérience et de vos multiples interactions avec les générateurs d’images par IA, vous avez développé une méthode. Pouvez-vous nous la présenter ?

J’ai effectivement mis en place une méthode qui s’appelle « O.B.S.E.R.V.E. ». Il s’agit d’un acronyme qui veut dire : Objectif, Briques, Structure, Environnement, Règles, Validation, et Enregistrement. J’ai créé cette méthode pour qu’elle soit facile à retenir. Voici comment elle se décompose précisément :

  • Objectif : pour définir clairement ce que l’on veut, le type d’image, l’ambiance, le style souhaité. Comme un brief créatif, avec un moodboard d’inspirations.
  • Briques : ce sont les éléments constitutifs de l’image (sujets, objets, arrière-plans, couleurs, textures).
  • Structure : pour organiser son prompt avec une hiérarchie des informations, en commençant par l’élément principal, puis en ajoutant des détails.
  • Environnement : pour situer l’image dans un contexte précis, une époque, des influences artistiques, un courant, etc. On peut même faire des mélanges improbables, par exemple « Picasso + Dior ».
  • Règles : pour appliquer des règles de composition (tiers, impairs, lignes directrices, cercle d’or…).
  • Validation : pour expérimenter, tester, et vérifier que le prompt fonctionne correctement.
  • Enregistrement : pour conserver ses prompts les plus efficaces au sein d’une bibliothèque, classés par usage (cinéma, BD, manga, logo, peinture, etc.), afin de mieux les retrouver.

Si vous suivez cette méthode, vous pouvez créer des séries d’images vraiment intéressantes. C’est comme en art : il faut 95 % de travail et 5 % de talent (sourire).

Je rajoute un conseil complémentaire : pour ceux qui ont vraiment la flemme, vous pouvez aussi demander à ChatGPT de vous aider à générer des prompts. Ce sera un peu comme la loi de Pareto : même avec peu d’efforts, vous obtiendrez quand même un résultat sympa.

En tant que photographe professionnel, en quoi les compétences traditionnelles restent des connaissances indispensables à maîtriser, même face à ces générateurs d’images par IA ?

Même si l’on peut s’en sortir en posant les bonnes questions à un chatbot IA, il faut quand même un minimum de culture, pour avoir l’idée de ce que l’on souhaite créer. Si l’on veut faire de belles images, il faut une certaine culture de l’image. La bonne nouvelle, c’est que l’on peut aussi faire le travail inversé : prendre une image qui nous plaît, l’analyser avec ChatGPT, lui demander quels sont les courants artistiques ou les règles de composition utilisées, puis générer d’autres prompts dans le même style.

Sans culture, vous ne serez pas en mesure de reconnaître ce qu’est « une belle image ». On peut certes se fier à ses émotions, mais cela reste limité.

Pour aller plus loin, si le sujet vous intéresse, rien ne vous empêche d’aller acheter un livre sur la composition photo, les styles d’éclairage, la peinture, l’illustration. Ce n’est pas une recette miracle, mais cela permet d’enrichir sa culture.

Avoir de la culture, dans un monde où coexistent l’IA et les réseaux sociaux, et où tout le monde a la flemme, c’est comme courir dans un monde où tout le monde est assis. C’est génial !

Quelles sont les principales erreurs à éviter pour ne pas générer un résultat trop stéréotypé, selon vous ?

Déjà, je recommande d’éviter les prompts trop courts ou trop longs. Par expérience, sur Midjourney, trois lignes de Word suffisent. Ni plus ni moins.

Autre erreur courante : ne pas utiliser le langage natif du modèle. Il vaut mieux rédiger en anglais, avec des mots courants, pour être sûr que l’IA comprenne bien votre demande.

Les IA génératives d’images sont beaucoup plus à l’aise dans leur langage natif, c’est-à-dire l’anglais. De même, dans le cas des plateformes chinoises, il est recommandé de leur parler en chinois.

Enfin, il faut toujours expérimenter, et ne pas croire qu’une fois votre premier prompt lancé, tout est figé. Insistez sur les éléments qui sont importants pour votre création. Si vous attendez un format « close-up », il faudra apporter à l’IA suffisamment de détails, sur les yeux, la peau, etc. De la même manière, pour un « zoom out », il faudra bien décrire les vêtements, les chaussures, tout ce qui permettra à l’IA de comprendre le prompt.

C’est ce que je trouve intéressant ici : il faut un peu « manipuler » l’IA pour arriver à ses fins. Comme un parent qui manipulerait son ado pour qu’il range sa chambre.

Sujets liés :
Publier un commentaire
Ajouter un commentaire

Votre adresse email ne sera pas publiée.

Visuel enquête Visuel enquête

Community managers : découvrez les résultats de notre enquête 2025

Réseaux, missions, salaire... Un webinar pour tout savoir sur les CM, lundi 29 septembre à 11h !

Je m'inscris

Les meilleurs générateurs d'images par IA