IA & vidéo : le réalisateur Gilles Guerraz présente sa sélection d’outils
Réalisateur et spécialiste de l’IA appliquée à la vidéo, Gilles Guerraz détaille pour BDM les outils incontournables dédiés à l’image, à la voix et à la musique.

Longtemps cantonnée à des expérimentations spectaculaires mais limitées, la vidéo générée par intelligence artificielle s’impose désormais dans le paysage créatif, de l’art à la publicité. Gilles Guerraz, réalisateur depuis 15 ans, s’est pleinement inscrit dans ce mouvement. Fondateur de NEXTREND, organisme de formation en IA créative, et cofondateur de BANGGER, une société de production spécialisée dans les workflows hybrides mêlant VFX traditionnels, 3D et IA, il est également à l’origine du PROMPT CLUB, un collectif de réalisateurs et réalisatrices IA, et de la newsletter GENERATIVE.
S’il suit de près les outils spécialisés comme Veo ou Sora, qu’il utilise dans des contextes d’exploration créative et dont il juge les progrès « spectaculaires », Gilles Guerraz privilégie une approche différente : garder la main sur la création et utiliser l’IA comme un ensemble de briques complémentaires. Upscale, animation d’images, génération de voix ou de sons… autant d’outils qu’il combine pour enrichir ses productions tout en conservant une direction artistique précise. À l’occasion d’un échange avec BDM, le réalisateur partage sa sélection d’outils incontournables.
1. ChatGPT, le partenaire créatif polyvalent
Sur le plan de la création vidéo, ChatGPT n’est pas forcément l’outil auquel on pense en premier. Pourtant, Gilles Guerraz est catégorique : « Si je ne devais conserver qu’un seul outil d’IA générative, ce serait ChatGPT », affirme le réalisateur. Il précise : « C’est un excellent partenaire créatif, toujours prêt à challenger mes idées et à m’en proposer d’autres… qui m’en inspirent de nouvelles. Un vrai cercle vertueux créatif. »
Concernant la génération d’images, OpenAI avait longtemps pris du retard face à ses concurrents spécialisés. Mais l’arrivée de 4o Image Generation, en mars 2025, a changé la donne. ChatGPT dispose désormais de solides capacités en matière de création visuelle, avec, en prime, une compréhension beaucoup plus fine des requêtes. Gilles Guerraz confirme : « Il est capable de créer des visuels de qualité, bien qu’un peu trop jaune, ou encore de modifier des visuels existants. »
2. Midjourney, la référence visuelle
Mais dans le domaine de la génération d’images, c’est Midjourney qui a la préférence de l’expert. Lancé début 2022, l’outil avait, dès ses débuts, impressionné par le réalisme de ses visuels. Depuis, la concurrence s’est renforcée avec l’arrivée de solutions comme Seedream, Reve ou Imagen de Google. Pourtant, pour Gilles Guerraz, Midjourney reste l’outil « vers lequel on revient toujours ».
Je l’utilise depuis 2022, et depuis la version 4, il me propose des visuels qui m’épatent quasiment à chaque génération. Outre la qualité visuelle extraordinaire de ses générations, Midjourney s’est enrichi d’une boîte à outils très complète au fil de ces 2 dernières années : cohérence de style et de personnages, image de référence, inpainting, outpainting et plus récemment, la vidéo.
Le réalisateur prévient toutefois : « Midjourney produit des images très typées, avec des partis pris visuels forts (composition, contraste, etc.) qui ne conviennent pas à tous les projets. »
Les images générées sont ensuite mises en mouvement. Pour ce faire, Gilles Guerraz utilise principalement des outils chinois comme Kling 2.1 et Seedance 1.0 « qui sont extrêmement performants pour animer de manière réaliste les visuels générés », estime-t-il, tout en concédant qu’ils « se comportent beaucoup mieux avec des séquences calmes plutôt que des scènes d’action ».
3. Upscaling, pour améliorer images et vidéos
L’upscaling consiste à améliorer la définition d’une image. Il s’agit d’un passage obligé pour obtenir un rendu professionnel. « Les générateurs d’images et de vidéos sont encore limités en définition et en résolution. Pour cette raison, les upscalers sont indispensables », explique Gilles Guerraz. Le réalisateur en utilise deux principaux :
- Pour les images, Magnific AI : l’outil, acquis par Freepik en mai 2024, permet « d’upscaler ses images jusqu’à 10 000 pixels de côté », précise le réalisateur. Il propose deux modes : Précision, qui conserve l’image de base, et Creative, qui permet d’ajouter une texture.
- Pour la vidéo, Topaz Video AI : le logiciel effectue « de l’upscaling non créatif, sans modification du rush d’origine, jusqu’en 8K », souligne Gilles Guerraz. Il permet notamment de réduire le bruit, d’améliorer la netteté ou encore de stabiliser une vidéo.
Évidemment, la qualité n’est jamais aussi bonne qu’avec un capteur 4K ou 8K dans une camera professionnelle, mais l’upscaling améliore sensiblement la qualité des vidéos IA, dont la définition est souvent limitée à 720p (1280 x 720 pixels).
4. ElevenLabs, la voix augmentée
La plupart des outils de génération de vidéo n’intègre pas de capacités vocales ou, lorsqu’ils le font, restent encore imprécis. Pour leurs productions, les vidéastes se tournent donc vers des générateurs de voix. À ce titre, « ElevenLabs est inévitable », estime Gilles Guerraz, qui juge la qualité du rendu bluffante.
Il permet de générer des voix ultra réalistes à partir de texte, de créer ses propres voix à partir de prompts descriptifs, de cloner sa voix, de modifier sa voix après l’avoir enregistrée, de générer des bruitages, de créer des voicebots ou encore de générer de la musique.
Fondée en 2022 par d’anciens membres de Google et Palantir, ElevenLabs propose un outil capable de varier les langues (Eleven v3 prend en charge 74 langues), les accents et les émotions. Sa valorisation est actuellement estimée à 3,3 milliards de dollars.
5. La musique avec Suno, Udio et Producer
L’IA peut aussi se révéler précieuse pour l’habillage sonore des vidéos. Sur ce point, Gilles Guerraz n’a pas arrêté son choix sur un outil unique et jongle entre plusieurs solutions : « Pour la musique, j’alterne entre Suno, Udio et Producer. Les trois ont leurs qualités et leurs défauts. […] Ils proposent des créations musicales intéressantes, tant par leur diversité que par leur qualité. »
Suno, qui a lancé sa V4 en novembre 2024, a progressivement séduit un large public grâce à sa capacité à créer des chansons avec des paroles sur mesure en quelques minutes. Mais à l’usage, c’est Producer qui remporte les faveurs de Gilles Guerraz : « Ce que j’aime avec Producer, c’est qu’il permet de ‘vibe composer’ ses morceaux. C’est-à-dire que la création passe par un dialogue avec un LLM, ce qui est plus riche qu’un simple prompt pour donner forme à son intention créative. » Bien plus confidentiel que ses concurrents, l’outil n’est actuellement accessible que sur invitation.
Bonus : les plateformes all-in-one
La production d’une vidéo par IA repose encore souvent sur un enchaînement complexe d’outils spécialisés. Cette fragmentation oblige les créateurs à jongler entre de multiples services et abonnements. Pour simplifier ce parcours, les plateformes all-in-one ont émergé en 2024 et gagné en maturité en 2025. Elles offrent un guichet unique regroupant plusieurs modèles de génération d’images et de vidéos, mais aussi des fonctions d’édition, d’upscaling, de création vocale ou sonore. Une façon de rationaliser la chaîne de production sans sacrifier la diversité des usages.
« Avant, il fallait multiplier les abonnements : Runway, Kling, Midjourney, Leonardo, Magnific AI, Dream Machine, ElevenLabs, etc. Aujourd’hui, on peut presque tout avoir au même endroit », constate Gilles Guerraz. Parmi ces outils figurent Freepik, Higgsfield, Krea.ai, Scenario, Weavy ou encore Flora. Mais le réalisateur nuance aussitôt : ces solutions globales ne remplacent pas toujours la précision ou la richesse des outils spécialisés. De nombreux professionnels conservent donc une combinaison d’abonnements, en fonction des besoins de chaque projet.

Gilles Guerraz, réalisateur expert en outils créatifs d'IA générative
Réalisateur publicitaire depuis plus de quinze ans, Gilles Guerraz explore aujourd’hui les possibilités créatives offertes par l’intelligence artificielle. Il met son expérience d’image et de narration au service de nouvelles formes de production, et partage ses découvertes à travers Generative, une newsletter francophone dédiée à la création augmentée par l’IA.
Community managers : découvrez les résultats de notre enquête 2025
Réseaux, missions, salaire... Un webinar pour tout savoir sur les CM, lundi 29 septembre à 11h !
Je m'inscris