Google présente Veo, son générateur de vidéo par IA : découvrez les premières images

Le nouveau modèle de génération de vidéos, Veo, viendra directement concurrencer Sora d’OpenAI. On fait le point.

Google io presentation
Veo est accessible aux États-Unis depuis la nouvelle plateforme VideoFX, en preview fermée. © Google

La Google I/O, qui s’est tenue mardi 14 mai, s’est avérée riche en nouveautés liées à l’IA, éclipsant la sortie d’Android 15. La firme de Mountain View a notamment profité de cet événement annuel pour détailler sa future expérience de recherche, introduire son nouveau modèle de génération d’images, et annoncer les dernières nouvelles concernant son chatbot Gemini.

Google a également dévoilé son nouveau modèle de génération de vidéo par IA, Veo, destiné à concurrencer directement Sora, le modèle lancé par OpenAI en février. Veo sera accessible depuis une nouvelle plateforme et intégré à certains outils de Google.

Veo : Google lance son modèle de génération de vidéo

Tout comme son rival Sora, Veo peut produire des vidéos en résolution 1080p à partir d’une simple requête textuelle. Selon Google, ce modèle est capable de comprendre les intentions de l’auteur ainsi que le vocabulaire spécifique au monde du cinéma.

Le modèle offre un niveau de contrôle créatif sans précédent et comprend des termes cinématographiques tels que « timelapse » ou « plans aériens d’un paysage ». Veo crée des séquences homogènes et cohérentes, de sorte que les personnes, les animaux et les objets se déplacent de manière réaliste tout au long des prises de vue.

La firme a déjà établi des collaborations avec des cinéastes, tels que Donald Glover, afin d’explorer les possibilités offertes par le modèle. Les premiers extraits présentés sont encourageants, bien qu’encore imparfaits :

Des fonctionnalités d’édition

Google souligne que Veo est le résultat de plusieurs années de travail sur divers modèles de vidéo génératifs tels que Generative Query Network (GQN), DVD-GAN, Imagen-Video, Phenaki, WALT, VideoPoet ou encore Lumiere. Pour améliorer les performances de son outil, Google utilise des modèles de diffusion latents, qui correspondent à des représentations compressées et de haute qualité de la vidéo. Cela facilite le traitement des données, réduit le temps de génération et améliore la qualité en limitant les incohérences.

Par ailleurs, Veo permettra la génération de vidéos à partir d’une image et de modifier des zones spécifiques d’une vidéo existante, en y intégrant par exemple de nouveaux éléments. Dans l’exemple ci-dessous, une image générée par IA a été mise en mouvement à l’aide de Veo.

Lamas Google
L’image a été générée à l’aide de Imagen 3. © Google

 

Pour assurer la traçabilité des vidéos, les contenus générés via Veo seront marqués d’un filigrane conçu avec l’outil maison, SynthID. Des « processus de vérification de la mémorisation » veilleront également à limiter les risques liés aux données privées et aux droits d’auteur.

VideoFX : une plateforme pour créer des vidéos

À l’avenir, Veo sera intégré à certains produits de Google, dont YouTube Shorts. Depuis hier, le modèle est également accessible en avant-première à un nombre restreint d’utilisateurs sur la nouvelle plateforme VideoFX. Pour l’instant disponible uniquement aux États-Unis, cette plateforme est équipée d’un mode storyboard qui permet de construire des séquences vidéo scène par scène :

VideoFX vient compléter une suite qui inclut déjà ImageFX, une interface dédiée à la génération d’images offrant un accès au dernier modèle, Imagen 3, ainsi que MusicFX, conçue pour la création de musique par IA.

Sujets liés :
Publier un commentaire
Ajouter un commentaire

Votre adresse email ne sera pas publiée.

Visuel enquête Visuel enquête

Community managers : découvrez les résultats de notre enquête 2025

Réseaux, missions, salaire... Un webinar pour tout savoir sur les CM, lundi 29 septembre à 11h !

Je m'inscris

Les meilleurs outils pour les professionnels du web