Top 10 des modèles d’IA les plus performants en mai 2025 : le classement complet

Pour le deuxième mois consécutif, les modèles de Google parviennent à supplanter ceux d’OpenAI.

Les deux premières places reviennent à Gemini. © LMSYS

Sommaire

La course à l’IA a repris de plus belle au printemps 2025. Au cours du dernier mois, les principaux acteurs du secteur – OpenAI, Google, Claude, Perplexity ou encore Mistral – ont tous dévoilé des nouveautés concernant leurs outils d’IA, tandis que de nouveaux modèles ont été présentés ou rendus accessibles à un public plus large. Mais, en termes de performances, qui tire son épingle du jeu ? C’est ce que tente de déterminer la Chatbot Arena, qui classe les meilleurs modèles d’IA du moment. Voici les grandes tendances de mai 2025.

Modèles d’IA générative : Gemini reste en tête

Google est manifestement la société qui s’est montrée la plus active sur le front de l’IA en mai 2025. Son événement annuel, le Google I/O, a presque été intégralement consacré aux nouveautés liées à l’intelligence artificielle, sous toutes ses formes : image et vidéo, recherche en ligne, Gemini… Et cet investissement semble porter ses fruits. Pour le deuxième mois consécutif, ce sont les modèles de Gemini qui font la course en tête dans la Chatbot Arena.

Les deux premières places sont raflées par Gemini 2.5 Pro et Gemini 2.5 Flash. Ces deux modèles, lancés à la fin du mois de mars 2025, ambitionnent de concurrencer la série « o » d’OpenAI sur le terrain des IA chain-of-thought, qui ont la capacité de décomposer les tâches avant d’apporter une réponse.

Le top 10 des modèles IA les plus performants en mai 2025

Depuis la fin de l’année 2024, les modèles d’OpenAI sont presque systématiquement devancés par ceux de la concurrence. Mais ils restent solidement ancrés dans le top 5. Ce mois-ci, les modèles o3 et 4o occupent les 3e et 4e places, tandis que GPT-4.5 se positionne au 6e rang. L’arrivée très attendue de GPT-5, annoncée comme imminente par Sam Altman, pourrait marquer un tournant et permettre à la startup de reprendre la tête du classement.

Dans le reste du top 10, on retrouve plusieurs habitués, dont Grok et DeepSeek, ainsi qu’un nouveau venu : Hunyuan-TurboS. Développé par Tencent, le géant chinois à l’origine de WeChat, ce modèle intègre lui aussi un mécanisme de raisonnement de type chain-of-thought.

Voici les 10 modèles d’IA les plus performants en mai 2025, selon la Chatbot Arena :

Gemini-2.5 Pro : 1 446 (score Elo)
Gemini-2.5 Flash : 1 418
OpenAI o3 : 1 409
ChatGPT 4o : 1 405
Grok-3 : 1 399
GPT-4.5 : 1 394
Gemini-2.5 Flash (version antérieure) : 1 387
DeepSeek V3 : 1 368
GPT-4.1 : 1 365
Hunyuan Turbos : 1 356

Chatbot Arena : les critères du classement

La Chatbot Arena, développée par la Large Model Systems Organization (LMSYS), vise à mesurer les performances des modèles d’intelligence artificielle en s’appuyant sur les jugements des utilisateurs. Sur la plateforme, ceux-ci sont invités à comparer deux modèles présentés de manière anonyme et à désigner celui qui, selon eux, a le mieux répondu à une requête donnée. Ce mécanisme de comparaison directe permet d’éviter les biais et d’assurer une certaine impartialité dans les évaluations.

Les résultats de ces duels servent à attribuer à chaque modèle un score Elo, une méthode de classement bien connue dans les échecs ou le jeu vidéo compétitif. Ce score évolue en fonction des performances : battre un adversaire mieux classé fait gagner des points, tandis qu’une défaite contre un modèle moins bien noté entraîne une perte.

Sujets liés :