Gemini peut désormais transcrire des fichiers audio : comment ça marche

À la différence de ChatGPT, Gemini peut désormais convertir un fichier audio en texte. Découvrez comment utiliser cette fonctionnalité.

Les utilisateurs peuvent transcrire un fichier audio dont la durée n'excède pas 10 minutes. © Montage BDM

Sommaire

Depuis ce lundi 8 septembre 2025, Gemini, l’agent conversationnel de Google, peut désormais analyser et transcrire le contenu d’un fichier audio, a annoncé Josh Woodward, vice-président en charge de Google Labs et de l’application Gemini. Certaines limitations ont néanmoins été mises en place pour les utilisateurs gratuits.

✅ Papercut fixed: You can now upload any file to @GeminiApp. Including the #1 request: audio files are now supported! pic.twitter.com/4Te3xwLC6W

— Josh Woodward (@joshwoodward) September 8, 2025

Pour afficher ce contenu issu des réseaux sociaux, vous devez accepter les cookies et traceurs publicitaires.

Ces cookies et traceurs permettent à nos partenaires de vous proposer des publicités et des contenus personnalisés en fonction de votre navigation, de votre profil et de vos centres d’intérêt.Plus d’infos.

Accepter

Gemini peut désormais transcrire des fichiers audio

Google a, semble-t-il, répondu à l’une des principales requêtes de ses utilisateurs en autorisant le téléchargement de fichiers audio sur Gemini. Sur la version web, iOS et Android, l’agent conversationnel peut désormais transcrire un fichier en quelques secondes. Et ce, quel que soit le format du fichier (MP3, M4A, WAV, etc.). Il est également capable d’en analyser son contenu ou d’en résumer les points clés.

La fonctionnalité de transcription et d’analyse de Gemini est néanmoins limitée, précise Google. Les utilisateurs de la version gratuite peuvent uploader des fichiers de 10 minutes maximum, et ont droit à cinq prompts par jour. Les abonnés aux formules Google AI Pro et Google AI Ultra bénéficient, quant à eux, d’une durée étendue à 3 heures. Il est possible d’importer jusqu’à 10 fichiers simultanément, complète une page d’aide.

Une fonctionnalité absente de ChatGPT

En intégrant une fonctionnalité déjà présente sur NotebookLM, un autre service de Google, Gemini se positionne comme une alternative aux solutions de transcription multilingue, à l’instar de Good Tape ou Vook.ai, dont les versions gratuites sont souvent limitées. Surtout, il propose une option dont ChatGPT ne dispose pas encore. Depuis juillet dernier, l’outil d’OpenAI offre bien un Mode Enregistrement sur la version macOS, mais celui-ci se restreint à la captation de réunions ou de séances de brainstorming. Et il reste, pour l’heure, réservé aux abonnés payants.

Comment transcrire un fichier audio avec Gemini

Voici la marche à suivre pour transcrire ou analyser un fichier audio dans Gemini :

Cliquez sur l’icône + située dans la barre de saisie,
Sélectionnez Importer des fichiers,
Choisissez un fichier audio (MP3, MP4, M4A, etc.) d’une durée maximale de 10 minutes,
Dans la barre de saisie, ajoutez un prompt pour préciser votre demande (« Transcris ce fichier », « Résume les points clés », etc.).

En savoir plus sur Gemini

Le générateur de texte par IA de Google

Sujets liés :

Publier un commentaire

Ajouter un commentaire

Les meilleurs logiciels Transcription

Diabolocom

Transcription

Un outil de transcription par IA pour le service client

Authôt

Transcription

Un outil de sous-titrage complet pour vos vidéos

1 tutoriel

Dictation

Transcription

Un outil de transcription audio gratuit

Gemini peut désormais transcrire des fichiers audio

Une fonctionnalité absente de ChatGPT

Comment transcrire un fichier audio avec Gemini

Les meilleurs logiciels Transcription

Diabolocom

Authôt

Dictation

Sur le même thème

Thèmes populaires