Quelle est la meilleure IA ? BDM a comparé ChatGPT, Gemini, Claude, Perplexity, Copilot, DeepSeek et Le Chat

BDM a comparé les différents outils d’IA générative sur certaines fonctionnalités spécifiques. Retour sur les principaux enseignements.

Comparatif final
Découvrez notre classement récapitulatif ! © BDM

Depuis 2023, ChatGPT, Gemini, Claude et consorts ont tous implémenté des fonctionnalités proches, voire identiques : intégration de la recherche web, de la lecture de documents et d’images, généralisation de modèles « chain-of-thought »… Certes, les outils font toujours valoir une certaine singularité – Gemini bénéficie de l’intégration dans l’écosystème Google, Claude s’adresse principalement aux professionnels, Perplexity se spécialise dans la recherche – mais, de manière générale, les principales IA du marché s’influencent entre elles et avancent dans la même direction.

C’est la raison pour laquelle, depuis quelques semaines, BDM s’est aventuré dans une série de comparatifs sur certaines fonctionnalités spécifiques. L’objectif : faire le point sur l’avancée des différents agents conversationnels. L’heure est venue de faire le bilan !

Deep Research : ChatGPT, Copilot et Perplexity sur le podium

Dans notre premier test, nous nous sommes intéressés à la capacité des IA à répondre à des questions complexes de manière à la fois précise et nuancée, en activant les fonctionnalités de réflexion et de recherche approfondie. Pour ce faire nous avons produit une analyse hybride, s’intéressant à la fois à la capacité des IA à récolter des sources fiables et pertinentes, mais également à la restitution des informations.

Nous avons constaté des performances particulièrement poussées pour Gemini et ChatGPT. Les deux concurrents ont offert des résultats similaires en termes de qualité des sources et de détail dans la restitution. Autre bon élève : Perplexity qui, malgré un résultat moins fourni, se distingue par la qualité de ses références et par une expérience utilisateur particulièrement réussie. À l’inverse, DeepSeek échoue à la fois sur la qualité des sources et sur la profondeur de son travail de restitution.

Consulter le test complet

Comparatif Deep Research
Gemini s’est révélé particulièrement performant dans ce test. © BDM

Analyse d’images : Gemini tire son épingle du jeu

Fin 2023, ChatGPT a intégré l’analyse d’image, une fonctionnalité que nous avions alors considérée bluffante par sa capacité à combiner analyse visuelle et réflexion. Depuis, la plupart des rivaux lui ont emboîté le pas. Avec autant de succès ?

Pas forcément : Mistral et Perplexity ont encore du chemin à faire. Le leader français manque notamment de précision dans son étude et éprouve des difficultés à lire le contenu textuel. DeepSeek, de son côté, s’est montré incapable d’activer correctement l’option.

Parmi les autres IA du marché, Copilot et Claude, malgré quelques imperfections, s’en tirent correctement, tandis que Gemini parvient à dépasser ChatGPT. L’IA de Google réalise presque un sans-faute, se montrant particulièrement pertinente sur l’analyse de graphiques.

Consulter le test complet

Analyse d’image
L’analyse d’image n’est pas le point fort de Perplexity. © BDM

Recherche web : carton plein pour ChatGPT

En 3 ans, les différents outils, ChatGPT en tête, ont réalisé des progrès considérables dans le domaine de la recherche en ligne. Début 2023, le chatbot d’OpenAI ne pouvait pas accéder au web en direct, se contentant de réponses limitées à 2021. Pour contourner cela, ChatGPT a d’abord noué un partenariat avec Bing, avant de lancer sa propre option Search et même son propre navigateur.

Manifestement, ChatGPT conserve une longueur d’avance sur ses concurrents : dans notre test, il cible systématiquement les bonnes informations, produit des réponses fiables et se protège contre les fake news. Perplexity et DeepSeek obtiennent également des résultats très honorables, malgré de très légères lacunes dans la gestion des sources.

Pour les autres outils, le résultat se révèle moins enthousiasmant. Gemini, Mistral et Copilot affichent notamment de très importantes lacunes au niveau des sources, ce qui a parfois nui au moment de la restitution.

Consulter le test complet

recherche-web-comparatif-ia
En termes de recherche web, Gemini et Copilot portent le bonnet d’âne. © Montage BDM

Analyse de PDF : le talon d’Achille de ChatGPT ?

ChatGPT s’est révélé excellent dans la quasi-totalité des tests que nous avons menés. La seule exception : l’analyse de PDF. Sur ce point, il produit à plusieurs reprises des résultats erronés, en confondant des chiffres, en particulier sur les documents volumineux. En termes de fiabilité, Mistral et Perplexity sont également en bas de classement, le moteur de recherche se montrant particulièrement maladroit, y compris sur les données les plus simples à extraire.

De manière générale, seul Gemini a réussi haut la main notre test d’analyse de PDF. L’IA de Google se distingue aussi bien dans le fond – il ne se trompe à aucun moment – que sur la forme, avec une restitution très lisible des informations. Seul défaut de Gemini : de peur de se tromper, il peine parfois à donner des informations pourtant indiquées dans le document. Mais Google dispose d’un atout supplémentaire : NotebookLM, spécialement adapté à ce type de tâches.

Consulter le test complet

comparatif-analyse-pdf
Mistral : un outil médiocre pour l’analyse de PDF. © BDM

Canvas : Claude au-dessus du lot

Claude s’impose clairement sur la fonction Canvas, dont il est à l’origine, avec sa fonctionnalité Artefacts. Le plan de travail est particulièrement bien construit et l’historique de versions est facilement consultable. Dans notre test, qui consistait en la réalisation d’une newsletter, l’outil d’Anthropic parvient à prendre en charge les différentes demandes sans encombre. ChatGPT, bien qu’un cran en dessous, réussit également bien le test.

Chez Gemini, le rendu est plus poussif. Il s’astreint à satisfaire les demandes, mais manque de bon sens dans leur mise en œuvre. Dans la création de la newsletter, ce défaut se manifeste par un titrage racoleur, une mauvaise hiérarchisation des informations et une gestion hasardeuse des couleurs.

Consulter le test complet

Canvas-comparatif
Claude nous a particulièrement convaincus sur ce test. © BDM
Sujets liés :
Publier un commentaire
Ajouter un commentaire

Votre adresse email ne sera pas publiée.

Visuel enquête Visuel enquête

Prenez la parole dans le dossier Tendances 2026

Associez votre expertise à l'un des contenus phares de BDM !

Je participe

Les meilleurs outils Visibilité LLM