Deux ans après son lancement, Le Chat rivalise-t-il avec ChatGPT ?

Lancé en février 2024, Le Chat a suscité un certain enthousiasme en France, s’imposant comme une alternative crédible aux solutions américaines. Mais a-t-il, deux ans après, rattrapé une partie de son retard sur ChatGPT ? BDM a testé.

BDM a testé plusieurs fonctionnalités phares : recherche web, génération d'images, analyse d'images, analyse de PDF, recherche approfondie. © Koshiro K - stock.adobe.com

Sommaire

Il était un early adopter pas comme les autres, celui dont on attend le verdict et que tous les médias s’arrachent, en ce mardi de février 2025. Quelques heures après avoir officialisé, lors du Sommet de l’IA à Paris, un investissement de 109 milliards d’euros pour le développement de projets et d’infrastructures liés à l’intelligence artificielle dans l’Hexagone, et à quelques minutes d’un déjeuner avec J.D. Vance, vice-président des États-Unis, Emmanuel Macron avait fait une brève halte au micro de 20 Minutes. Pour, comme souvent lors de cet événement international au Grand Palais, s’improviser ambassadeur d’un produit de Mistral AI : l’agent conversationnel Le Chat. « Je l’ai téléchargé, c’est le modèle de langage français, c’est la référence européenne et il m’aide au quotidien. Tous ceux qui ont ChatGPT, je leur conseille de télécharger Le Chat », avait-il glissé. Un presidential endorsement, comme on dit outre-Atlantique.

La hype autour de ce chatbot français dépasse la seule figure du président de la République. Depuis son lancement, en février 2024, Le Chat fait figure d’alternative souveraine et analogue aux solutions américaines, se démarquant par une très bonne maîtrise du français et « des biais culturels et des valeurs européennes », également « plus vertueux en termes de confidentialité et de transparence », vantait Arthur Mensch, polytechnicien et cofondateur de Mistral AI, dans les colonnes du Parisien. Il apparait surtout comme la vitrine d’une entreprise que l’on a, en France, rapidement placée dans la cour des grands, reconnaissant seulement un léger retard sur des acteurs comme OpenAI, Anthropic ou le chinois DeepSeek. À tort ou à raison ?

C’est ce que nous avons tenté d’évaluer, deux ans après son lancement, en le confrontant à ChatGPT sur plusieurs critères, aussi bien techniques que fonctionnels. Pour ce test, nous avons utilisé les versions gratuites de chaque outil, alimentées par le modèle Mistral Large 2 pour Le Chat, et par GPT-5.3 pour ChatGPT.

Périmètre fonctionnel : (léger) avantage Le Chat, grâce aux limites d’utilisation

Avant de jauger les performances, il faut comparer le périmètre. Sur ce terrain, difficile de désigner un vainqueur, d’autant que l’accès aux fonctionnalités varie sensiblement selon les périodes ou la profondeur du catalogue d’offres payantes. Autre obstacle à la comparaison : les limites d’utilisation sont rarement, pour ne pas dire jamais, communiquées publiquement. Avoir des fonctionnalités, c’est bien. Encore faut-il pouvoir y accéder régulièrement.

L’agent conversationnel d’OpenAI a pour lui d’être un pionnier. Il s’est doté plus tôt d’un large éventail de fonctionnalités, et en a même imposé certaines qui font désormais référence. Son point faible ? En version gratuite, il se heurte rapidement à son plafond d’utilisation, plus encore depuis le lancement de l’abonnement ChatGPT Go. Il donne néanmoins accès, entre autres, à la génération d’images, à la recherche approfondie, à la mémoire, à la commande vocale, aux GPT personnalisés, aux projets, et même à une version limitée de Codex. Une richesse fonctionnelle à laquelle Le Chat n’a pas grand-chose à envier : l’agent de Mistral AI dispose d’un arsenal comparable, auquel s’ajoutent un mode réflexion baptisé Think Mode, des connecteurs et une fonctionnalité Canvas, désactivée par défaut. Nous accorderions toutefois un léger avantage à Le Chat, dont les quotas, notamment sur les requêtes classiques, semblent plus souples dans sa formule standard.

La recherche web : (léger) avantage Le Chat

Lors d’un précédent test, en octobre dernier, nous avions observé que Le Chat, bien que très rapide dans la génération de ses réponses, avait la fâcheuse tendance à produire des réponses superficielles, peu sourcées, et qu’il ne faisait pas preuve de prudence lorsqu’il manquait d’informations officielles. La situation a-t-elle évolué, depuis ?

Pour le savoir, nous avons soumis deux prompts à Le Chat et ChatGPT : l’un portant sur une actualité récente, pour évaluer sa capacité à s’affranchir de leur corpus, et l’autre portant sur une fausse information circulant sur le web :

« Quel établissement public administratif, en France, a été victime d’une fuite de données le 15 avril 2026 ? Appuie ta réponse sur des sources fiables et indique combien de citoyens français sont potentiellement concernés ».
« Cette information circule en ligne : dans le New Jersey, aux États-Unis, un castor a traversé la route en transportant un arbre entier, provoquant un embouteillage. Vérifie si cette affirmation est vraie ou fausse, cite tes sources et explique ton raisonnement ».

Le constat, c’est qu’il y a du mieux pour l’outil français. Cette fois encore, Le Chat affiche une rapidité de traitement particulièrement élevée et a livré une réponse succincte, mais correcte, en deux secondes. Sur le prompt d’actualité, il s’est appuyé sur huit sources de fiabilité variable, parmi lesquelles des médias français comme Ouest-France ou La Voix du Nord. Il a correctement identifié le nombre de personnes touchées, allant même plus loin en signalant que certaines sources non officielles avançaient un chiffre plus élevé. Le débunking de la fausse information ne lui a pas posé davantage de difficultés, s’appuyant cette fois sur une source unique, 20 Minutes. Soit celle qui avait été utilisée par l’auteur de cet article pour rédiger le prompt.

Le bilan est moins brillant pour ChatGPT, qui a certes répondu correctement à la question d’actualité, mais en citant des sources peu fiables, à l’exception de RTL, alors qu’un communiqué du ministère de l’Intérieur était disponible en ligne. Il a bien compris que la fausse information provenait d’une vidéo générée par IA, en se basant sur un article de Yahoo News, mais a tenu à expliquer pourquoi cette information semblait crédible, rappelant que, oui, des castors « peuvent traverser des routes avec de grosses branches et perturber brièvement la circulation ». Chacun jugera de l’utilité de la précision.

Les résultats des requêtes incluant une recherche web soumises à Le Chat et ChatGPT © Capture BDM

Screenshot — Les résultats des requêtes incluant une recherche web soumises à Le Chat et ChatGPT © Capture BDM

L’analyse d’images : avantage ChatGPT

Pour évaluer la précision et la pertinence de l’analyse d’images, nous avons soumis à chaque solution deux tests : un graphique issu d’une étude de Surfshark à analyser et expliquer, et une capture d’écran de notre compte Instagram associée au prompt « Comment accéder à mon dashboard professionnel », volontairement sans préciser la plateforme, pour mesurer leur capacité à se repérer dans une interface.

Sur le test d’interface, les résultats se révèlent mitigés, aussi bien pour ChatGPT que pour Le Chat. Après une réflexion très courte, les deux outils ont manqué l’accès direct visible dans la barre latérale, et ont tous deux décrit des chemins corrects, mais propres à l’application mobile, alors qu’il s’agissait de la version web. Ils ont néanmoins identifié qu’il s’agissait d’Instagram, et ont vraisemblablement puisé dans leur base de connaissances pour proposer une solution, Instagram modifiant régulièrement des éléments dans son interface. ChatGPT n’a d’ailleurs pas manqué de le signaler, pour justifier son choix de proposer plusieurs alternatives : « Instagram change régulièrement l’emplacement de cette entrée ».

L’exercice s’est révélé plus concluant sur l’analyse de graphique. Sans chercher à identifier chaque application, Le Chat a bien appréhendé la thématique et détaillé avec précision la structure du graphique, la signification des axes, des couleurs et des légendes, ainsi que l’intérêt d’un tel contenu pour les utilisateurs. L’agent conversationnel d’OpenAI, de son côté, a pris le temps de la réflexion : sans identifier les applications non plus — sauf ChatGPT, quand même — il a poussé la lecture plus loin, s’épanchant notamment sur le niveau de sensibilité de chaque donnée. Il a également apporté un peu de contexte sur leur provenance, en rappelant que le visuel était, sans doute, construit à partir des informations de l’App Store, des déclarations « auto-reportées par les éditeurs ». La réponse était lisible et structurée, articulée en plusieurs parties avec un cheminement logique et des listes à puces.

L'analyse est davantage poussée sur ChatGPT © Capture BDM

La génération d’images : avantage ChatGPT

La génération d’images étant un terrain particulièrement difficile à évaluer sans tomber dans la subjectivité, nous avons choisi de tester le suivi des instructions, un critère que les acteurs brandissent à chaque amélioration de leurs modèles pour se démarquer de la concurrence. Nous avons soumis à chaque outil une requête combinant description physique, environnement, conditions d’éclairage, cadrage et angle de vue :« Génère une femme d’une quarantaine d’années, cheveux courts gris, assise à un bureau en bois clair encombré de livres et de plantes vertes, regardant par une grande fenêtre donnant sur une rue parisienne sous la pluie. Lumière naturelle tamisée, ambiance intimiste. Plan moyen, légèrement en contre-plongée ».

Pour qui suit de près l’actualité, pas de surprise : ChatGPT dispose d’un avantage technologique certain en matière de génération d’images. Le modèle GPT Images 2.0, tout juste déployé et qui caracole en tête des benchmarks collaboratifs, notamment celui d’Artificial Analysis, tient sa promesse : toutes les consignes ont été respectées à la lettre et le rendu est, il faut le reconnaître, assez bluffant. ChatGPT parvient même à générer une rue authentiquement parisienne, avec ses immeubles haussmanniens. Au-delà de l’aspect visuel, le résultat de Le Chat, dont l’outil de génération s’appuie sur les modèles de Black Forest Labs, est moins convaincant : plus artificiel, avec une lumière loin d’être tamisée et une rue parisienne qui semble délibérément floutée.

chatgpt-generation-image — Les images générées par ChatGPT et Le Chat © Captures BDM

lechat-generation-image — Les images générées par ChatGPT et Le Chat © Captures BDM

L’analyse de PDF : avantage ChatGPT

Pour évaluer cette compétence, déployée depuis plusieurs mois sur Le Chat comme sur ChatGPT, nous avons soumis à chaque outil la dernière édition du guide des salaires d’Aquent, accompagnée d’une requête volontairement simple : « Quel est le poste le mieux rémunéré de cette étude, et quel est son salaire médian ? »

L’idée l’était tout autant : tester leur capacité à parcourir l’ensemble du PDF sans s’arrêter aux premières pages, à identifier le salaire le plus élevé parmi plusieurs rémunérations comparables, et à restituer un chiffre exact. Un exercice qui, on le sait, s’avère parfois périlleux pour l’IA.

L’avantage revient, là encore, clairement à ChatGPT, qui a concentré sa recherche sur les postes de direction, partant du postulat logique que ces fonctions étaient les mieux rémunérées. Il a correctement identifié le poste au salaire médian le plus élevé, en se payant même le luxe de livrer une succincte analyse. Le Chat, qui a répondu presque instantanément, a en revanche commis une erreur de méthode en se basant uniquement sur la fourchette haute. Et il n’a finalement pas rempli la mission : le poste identifié n’était pas le mieux rémunéré, même dans cette fourchette.

La recherche approfondie : avantage ChatGPT

Pour comparer les fonctionnalités Deep Research de ChatGPT et Le Chat, nous avons soumis un prompt identique aux deux outils : « Dans quelle mesure les médias traditionnels ont-ils adapté leur modèle économique face à la baisse du trafic organique liée à l’essor des réponses IA dans les moteurs de recherche ? » L’objectif était d’évaluer la capacité de l’outil à synthétiser des données dispersées, chiffrées et parfois contradictoires, en s’appuyant principalement sur des sources reconnues et en hiérarchisant l’information.

Le mode Research de Le Chat, limité à cinq recherches par mois en version gratuite, ouvre le processus en posant des questions complémentaires pour mieux cibler la recherche, puis propose une structure étape par étape que l’utilisateur peut ajuster avant de lancer l’analyse. Lors du test, il a conduit sa recherche documentaire en arrière-plan pendant une quinzaine de minutes, un délai qu’il avait lui-même annoncé. ChatGPT, qui s’accorde un long délai de réflexion, offre moins de prise et de flexibilité que son concurrent français, laissant simplement la possibilité d’ajuster la requête en cours de route.

Si les deux solutions convergent vers une même conclusion, le rapport produit par Le Chat s’avère plus superficiel, structuré en listes à puces et basé sur des sources moins fiables que celles de ChatGPT. Le chatbot d’OpenAI, plus à l’aise dans l’exercice, pose le contexte, retrace la chronologie dans une frise et évalue les impacts en s’appuyant sur des références comme Search Engine Land, des ressources gouvernementales ou des études provenant de SimilarWeb et SEMrush. Les deux proposent néanmoins des études de cas et des recommandations pour les éditeurs, ce qui mérite d’être souligné.