Comment générer de la musique par IA avec Stable Audio : le guide complet

Stable Audio est un outil de génération par IA d’extraits musicaux et d’effets sonores, créé par Stability AI. Découvrez comment il fonctionne !

Stable Audio vous permet de générer gratuitement 20 extraits musicaux ou effets sonores. © Montage BDM

Sommaire

Qu’est-ce que Stable Audio ?

Les générateurs assistés par l’intelligence artificielle se sont largement démocratisés au cours de l’année 2023. Des IA génératrices de texte, comme ChatGPT, à celles qui créent des images, comme Midjourney ou DALL-E, en passant par la génération de vidéo (Gen-2), tous les domaines de la création y passent, et l’audio n’y échappe pas. Plusieurs outils existent pour générer de la musique grâce à l’IA, et Stable Audio en fait partie.

Développé par Stability AI, déjà éditeur de Stable Diffusion pour la génération d’images, Stable Audio vous permet de générer des extraits musicaux – de la séquence orchestrale au sample d’instruments -, mais également des effets sonores. Les versions payantes de l’outil vous donnent d’ailleurs les droits d’utilisation commerciale des extraits que vous avez créés.

Comment générer de la musique avec Stable Audio

1. Se connecter à la plateforme Stable Audio

Stable Audio permet aux utilisateurs non payants de générer jusqu’à 20 extraits gratuitement. Pour cela, il vous faudra vous créer un compte sur la plateforme. Rendez-vous à cette adresse, puis cliquez en haut à droite de votre écran sur le bouton Try it out for free pour créer votre compte, ou directement sur Log in pour vous connecter.

Stable Audio – connexion — Connectez-vous à Stable Audio en utilisant les boutons ad hoc en haut à droite de votre écran. © Montage BDM

2. Générer de la musique avec Stable Audio

Une fois connecté à Stable Audio, vous pouvez dès à présent générer de la musique ou des effets sonores. Pour ce faire, le processus est similaire à n’importe quel générateur par IA. Il vous suffit en effet de rédiger un prompt au sein de la boîte de dialogue prévue à cet effet. Effectuez votre requête en demandant simplement à Stable Audio de vous générer un thème musical ou un effet sonore, par exemple un air de des oiseaux qui chantent ou un solo de batterie, puis cliquez sur la flèche située sous la fenêtre d’invite. En quelques secondes, l’outil créera votre séquence audio.

Stable Audio – génération — Rédigez votre prompt comme sur la plupart des générateurs assistés par IA. © Montage BDM

Quelles possibilités offre Stable Audio ?

Trois types de contenu principaux

Avec Stable Audio, il est possible de générer trois types de contenus distincts, explique la plateforme. Vous pouvez créer :

Des versions instrumentales complètes : utilisez Stable Audio pour générer une séquence audio comprenant toute une gamme d’instruments. La plateforme donne pour cela plusieurs exemples de prompts, comme « Lofi hip hop beat » ou « Calm meditation music to play in a spa lobby », et vous encourage à inclure le plus de détails possibles.
Des stems ou samples d’instrument(s) : il vous est possible de générer un stem ou un sample issu d’un seul et unique instrument ou groupe d’instruments, tel que « Samba percussion », « Drum solo » ou encore « Electric guitar top line solo instrumental, no drums, classic rock, 105 BPM ».
Des effets sonores : Stable Audio peut aussi être utilisé pour créer des effets sonores, tels qu’une sonnerie de téléphone, le son d’une explosion, d’une voiture qui passe dans la rue, d’oiseaux qui chantent, etc.

Comment bien rédiger son prompt

Pour le moment sur Stable Audio, la rédaction d’un prompt se fait en anglais uniquement, même si bien des termes musicaux sont proches de notre français. Il vous faudra donc d’abord faire un petit effort de traduction pour adapter votre requête. La plateforme met en place un petit guide pour vous aider à rédiger vos invites de la meilleure des façons. « C’est ce qui fonctionne pour nous, explique Stable Audio, et nous vous encourageons à expérimenter l’outil et trouver ce qui marche pour vous ! » Voici la marche à suivre proposée par Stable Audio :

Ajouter des détails : les genres musicaux, phrases descriptives, instruments et ambiances « fonctionnent particulièrement bien ».
Définir l’ambiance : pour cela, vous pouvez associer des termes musicaux et émotionnels. Par exemple, une séquence audio peut être « groovy » ou « rythmée », et l’émotion dégagée peut être « triste », « nostalgique », « festive ».
Choisir des instruments : Stable Audio constate qu’il est utile d’ajouter des adjectifs aux noms d’instruments, comme un « chœur puissant », des « cordes vibrantes », etc.
Définir le tempo : régler le BPM (battement par minute) va permettre à Stable Audio de bien définir le tempo de votre extrait musical. La clé est d’essayer de s’en tenir aux BPM adaptés au style musical que vous générez. Par exemple, pour un extrait instrumental de hip hop dans un style « boom bap », précisez à l’IA que vous souhaitez un BPM de 90.

Paramétrer les derniers détails

Maintenant que vous savez comment rédiger votre prompt, il ne vous reste plus qu’à gérer les derniers détails avant de générer l’extrait souhaité puis de le télécharger. Plusieurs points sont à noter :

La version sans abonnement de Stable Audio vous permet de générer 20 extraits gratuitement, d’une durée maximale de 45 secondes,
Sous la boîte de dialogue où vous rédigez votre prompt, vous pouvez ajuster la durée de votre extrait,
Une fois votre extrait généré, vous pouvez le télécharger en MP3 gratuitement, ou en WAV si vous profitez d’une offre payante, en cliquant sur le bouton prévu à cet effet sous l’extrait généré ou sous la boîte de dialogue, dans votre bibliothèque de création.

Stabe Audio – time and download — Ajustez la durée de l’extrait sous la boîte de dialogue (en vert) ; téléchargez-le avec les boutons dédiés (en rouge). © Montage BDM

Les plans payants permettent, pour l’offre à 11,99 $/mois, la génération de 500 extraits d’une durée maximale de 90 secondes par mois, et le téléchargement de votre création en format WAV ; pour l’offre supérieure (prix sur devis), un nombre de génération et une durée maximale personnalisés. Ces deux offres payantes offrent un usage commercial des extraits créés.

Quelques exemples des extraits musicaux créés avec Stable Audio

Nous avons expérimenté l’outil avec plusieurs exemples de prompts. Tous les extraits ont été générés et téléchargés avec l’offre gratuite. Voici les résultats.

Prompt :Hip hop boom bap beat, MPC 1000, 90 BPM, east coast new york, beat, snares, charley, piano melody