Gemini peut désormais transcrire des fichiers audio : comment ça marche

À la différence de ChatGPT, Gemini peut désormais convertir un fichier audio en texte. Découvrez comment utiliser cette fonctionnalité.

google-gemini-transcription
Les utilisateurs peuvent transcrire un fichier audio dont la durée n'excède pas 10 minutes. © Montage BDM

Depuis ce lundi 8 septembre 2025, Gemini, l’agent conversationnel de Google, peut désormais analyser et transcrire le contenu d’un fichier audio, a annoncé Josh Woodward, vice-président en charge de Google Labs et de l’application Gemini. Certaines limitations ont néanmoins été mises en place pour les utilisateurs gratuits.

Pour afficher ce contenu issu des réseaux sociaux, vous devez accepter les cookies et traceurs publicitaires.

Ces cookies et traceurs permettent à nos partenaires de vous proposer des publicités et des contenus personnalisés en fonction de votre navigation, de votre profil et de vos centres d’intérêt.Plus d’infos.

Accepter

Gemini peut désormais transcrire des fichiers audio

Google a, semble-t-il, répondu à l’une des principales requêtes de ses utilisateurs en autorisant le téléchargement de fichiers audio sur Gemini. Sur la version web, iOS et Android, l’agent conversationnel peut désormais transcrire un fichier en quelques secondes. Et ce, quel que soit le format du fichier (MP3, M4A, WAV, etc.). Il est également capable d’en analyser son contenu ou d’en résumer les points clés.

La fonctionnalité de transcription et d’analyse de Gemini est néanmoins limitée, précise Google. Les utilisateurs de la version gratuite peuvent uploader des fichiers de 10 minutes maximum, et ont droit à cinq prompts par jour. Les abonnés aux formules Google AI Pro et Google AI Ultra bénéficient, quant à eux, d’une durée étendue à 3 heures. Il est possible d’importer jusqu’à 10 fichiers simultanément, complète une page d’aide.

Une fonctionnalité absente de ChatGPT

En intégrant une fonctionnalité déjà présente sur NotebookLM, un autre service de Google, Gemini se positionne comme une alternative aux solutions de transcription multilingue, à l’instar de Good Tape ou Vook.ai, dont les versions gratuites sont souvent limitées. Surtout, il propose une option dont ChatGPT ne dispose pas encore. Depuis juillet dernier, l’outil d’OpenAI offre bien un Mode Enregistrement sur la version macOS, mais celui-ci se restreint à la captation de réunions ou de séances de brainstorming. Et il reste, pour l’heure, réservé aux abonnés payants.

Comment transcrire un fichier audio avec Gemini

Voici la marche à suivre pour transcrire ou analyser un fichier audio dans Gemini :

  • Cliquez sur l’icône + située dans la barre de saisie,
  • Sélectionnez Importer des fichiers,
  • Choisissez un fichier audio (MP3, MP4, M4A, etc.) d’une durée maximale de 10 minutes,
  • Dans la barre de saisie, ajoutez un prompt pour préciser votre demande (« Transcris ce fichier », « Résume les points clés », etc.).
Sujets liés :
Publier un commentaire
Ajouter un commentaire

Votre adresse email ne sera pas publiée.

Les meilleurs outils pour les professionnels du web