Gemini peut désormais transcrire des fichiers audio : comment ça marche
À la différence de ChatGPT, Gemini peut désormais convertir un fichier audio en texte. Découvrez comment utiliser cette fonctionnalité.
Depuis ce lundi 8 septembre 2025, Gemini, l’agent conversationnel de Google, peut désormais analyser et transcrire le contenu d’un fichier audio, a annoncé Josh Woodward, vice-président en charge de Google Labs et de l’application Gemini. Certaines limitations ont néanmoins été mises en place pour les utilisateurs gratuits.
✅ Papercut fixed: You can now upload any file to @GeminiApp. Including the #1 request: audio files are now supported! pic.twitter.com/4Te3xwLC6W
— Josh Woodward (@joshwoodward) September 8, 2025
Pour afficher ce contenu issu des réseaux sociaux, vous devez accepter les cookies et traceurs publicitaires.
Ces cookies et traceurs permettent à nos partenaires de vous proposer des publicités et des contenus personnalisés en fonction de votre navigation, de votre profil et de vos centres d’intérêt.Plus d’infos.
Gemini peut désormais transcrire des fichiers audio
Google a, semble-t-il, répondu à l’une des principales requêtes de ses utilisateurs en autorisant le téléchargement de fichiers audio sur Gemini. Sur la version web, iOS et Android, l’agent conversationnel peut désormais transcrire un fichier en quelques secondes. Et ce, quel que soit le format du fichier (MP3, M4A, WAV, etc.). Il est également capable d’en analyser son contenu ou d’en résumer les points clés.
La fonctionnalité de transcription et d’analyse de Gemini est néanmoins limitée, précise Google. Les utilisateurs de la version gratuite peuvent uploader des fichiers de 10 minutes maximum, et ont droit à cinq prompts par jour. Les abonnés aux formules Google AI Pro et Google AI Ultra bénéficient, quant à eux, d’une durée étendue à 3 heures. Il est possible d’importer jusqu’à 10 fichiers simultanément, complète une page d’aide.
Une fonctionnalité absente de ChatGPT
En intégrant une fonctionnalité déjà présente sur NotebookLM, un autre service de Google, Gemini se positionne comme une alternative aux solutions de transcription multilingue, à l’instar de Good Tape ou Vook.ai, dont les versions gratuites sont souvent limitées. Surtout, il propose une option dont ChatGPT ne dispose pas encore. Depuis juillet dernier, l’outil d’OpenAI offre bien un Mode Enregistrement sur la version macOS, mais celui-ci se restreint à la captation de réunions ou de séances de brainstorming. Et il reste, pour l’heure, réservé aux abonnés payants.
Comment transcrire un fichier audio avec Gemini
Voici la marche à suivre pour transcrire ou analyser un fichier audio dans Gemini :
- Cliquez sur l’icône + située dans la barre de saisie,
- Sélectionnez Importer des fichiers,
- Choisissez un fichier audio (MP3, MP4, M4A, etc.) d’une durée maximale de 10 minutes,
- Dans la barre de saisie, ajoutez un prompt pour préciser votre demande (« Transcris ce fichier », « Résume les points clés », etc.).