OpenAI lance Sora 2 et une application inspirée de TikTok pour partager vos vidéos
Pour OpenAI, Sora 2 est à la vidéo par IA ce que GPT-3.5 était aux générateurs de texte.
Depuis le lancement de Sora en début d’année, OpenAI avait peu communiqué sur son générateur de vidéos IA, préférant se concentrer sur la sortie de GPT-5 et de nouvelles fonctionnalités pour ChatGPT. Mais alors que la concurrence s’est accentuée, notamment du côté de Google et d’Adobe, OpenAI passe à la vitesse supérieure. Sur son blog, la firme annonce deux nouveautés : la sortie de Sora 2, plus performant, et le lancement d’une nouvelle application destinée au partage des vidéos.
Sora 2 : plus performant, plus maniable et plus réaliste
En février, à sa sortie en France, nous avions été séduits par Sora, qui représentait un début prometteur. Mais le générateur enregistrait un certain nombre de lacunes : des difficultés récurrentes sur les séquences dynamiques, une compréhension imparfaite des styles demandés ou encore enfin une impression générale de flottement, sans véritable rythme.
Selon OpenAI, Sora 2 est « plus précis, plus réaliste et plus facile à contrôler que les systèmes précédents ». Pour illustrer le bond en avant que constitue cette nouveauté, la firme s’essaie à un parallèle avec ChatGPT : « Le modèle Sora original de février 2024 a marqué, à bien des égards, l’avènement du GPT-1 pour la vidéo […] Avec Sora 2, nous entrons directement dans ce que nous pensons être l’avènement du GPT-3.5 pour la vidéo ». Autrement dit : une révolution.
Les modèles vidéo antérieurs sont trop optimistes : ils transforment les objets et déforment la réalité pour répondre à une invite textuelle. Par exemple, si un basketteur rate un tir, le ballon peut se téléporter spontanément vers le panier. Dans Sora 2, si un basketteur rate un tir, le ballon rebondit sur le panneau, illustre OpenAI.
Des fonctionnalités inédites
Sora 2 ne se contente pas d’améliorer l’existant. La nouvelle version intègre de nouvelles options pour faire passer la création vidéo à l’étape supérieure. Le modèle peut désormais générer de l’audio : dialogues, effets sonores et ambiances s’ajoutent aux images, avec une synchronisation qui rapproche le résultat d’une production audiovisuelle complète.
OpenAI introduit aussi les caméos, une fonction qui permet d’insérer une personne réelle dans une scène générée, avec une restitution fidèle du visage, de la voix et des mouvements. Cette possibilité s’applique également aux animaux et aux objets, ce qui ouvre la voie à des mises en scène inédites.
Une application inspirée de TikTok pour partager ses vidéos
En parallèle du lancement de Sora 2, OpenAI dévoile une application pensée pour la création et le partage de vidéos. Disponible uniquement sur iOS aux États-Unis et au Canada, elle reprend les codes de TikTok, avec un fil personnalisé et la possibilité de découvrir les contenus des autres utilisateurs.Les caméos y occupent une place centrale. Après un court enregistrement vidéo et audio, un utilisateur peut apparaître dans les scènes générées, et inviter ses amis à faire de même.
Par défaut, les adolescents voient un nombre limité de créations chaque jour et bénéficient de contrôles parentaux renforcés. Concernant l’utilisation de l’image, OpenAI promet plusieurs garde-fous :
- Contrôle du consentement : l’utilisateur garde le pouvoir sur l’usage de son image et de sa voix. Il peut décider qui y a accès et retirer ce droit quand il le souhaite.
- Provenance et traçabilité : chaque vidéo générée par Sora garde une marque d’origine qui permet de prouver qu’elle vient bien de l’IA, pour limiter la prolifération de deepfakes.
- Sécurité et modération : l’application combinera des outils automatiques et des modérateurs humains pour détecter rapidement les usages abusifs et de limiter les dérives.
Reste à savoir si les mesures de protection seront efficaces, et si l’humanité sortira réellement grandie d’une copie de TikTok consacrée aux vidéos IA.