Top 20 des modèles d’IA les plus performants en octobre 2025 : le classement complet
La dégringolade continue pour GPT-5, de moins en moins bien noté par ses utilisateurs. Une situation qui profite notamment à Anthropic, avec Claude, et Google, avec Gemini.
Dévoilé en grande pompe à l’été 2025, et rapidement critiqué, le dernier modèle d’OpenAI, GPT-5, n’en finit plus de descendre dans le classement de la LMArena. Ce ranking, basé sur les votes des utilisateurs, place Claude ou Gemini bien devant le poids lourd du marché. On fait le point !
Les 10 modèles d’IA les plus performants en octobre 2025
Sixième en septembre, GPT-5 pointe désormais à la huitième place du classement établi par la LMArena. Une chute qui le voit dépassé par ses prédécesseurs, GPT-4.5 (4e) et GPT-4o (5e). En tête, on retrouve deux modèles d’Anthropic, avec Claude Opus 4.1 à la première place, et Claude Sonnet 4.5 à la deuxième. Google complète le podium avec Gemini 2.5 Pro. Au final, le top 10 de ce mois d’octobre 2025 consacre trois éditeurs : Anthropic, donc, qui place également deux autres versions d’Opus et Sonnet dans les 10 premières places ; Google, avec un modèle Gemini ; et OpenAI, qui ajoute son modèle o3 à la neuvième position. Seul le modèle chinois d’Alibaba, Qwen3 parvient à obtenir le dixième rang.
Du côté des autres acteurs non étatsuniens, on peut noter la 16e place du Chinois DeepSeek, ou la 34e place du Français Mistral AI.
Voici le top 10 des modèles d’IA les plus performants en octobre 2025 selon la LMArena :
- Claude Opus 4.1 « thinking »
- Claude Sonnet 4.5 « thinking »
- Gemini 2.5 Pro
- GPT-4.5 Preview
- ChatGPT-4o
- Claude Opus 4.1
- Claude Sonnet 4.5
- GPT-5 « high »
- o3
- Qwen3 Preview
IA : les modèles les plus performants par domaine
La LMArena propose désormais des classements détaillés selon certaines capacités spécifiques des IA généralistes, comme la recherche web ou la génération d’images. Tour d’horizon des leaders par domaine d’activité !
- Génération de texte : Gemini 2.5 Pro reste leader dans ce domaine, devant les deux modèles « thinking » de Claude, à savoir Opus 4.1 et Sonnet 4.5. GPT-5 n’est que huitième, dépassé par trois anciens modèles d’OpenAI.
- Développement web : OpenAI remporte enfin un classement, avec GPT-5 « high » qui s’impose devant trois modèles d’Anthropic, deux versions de Claude Opus et une de Sonnet.
- Génération d’images : petite surprise avec la première place du modèle de Tencent, Hunyuan Image 3.0, dans la catégorie text-to-image. Il s’impose devant Google et Gemini 2.5 Flash Image et Imagen 4.0 Ultra. Deux modèles Seedream complètent le top 5, GPT-Image glisse à la septième place.
- Recherche web : Grok-4 reste en tête ce mois-ci, devançant Gemini 2.5 Pro et o3. Perplexity, spécialiste en la matière, ne pointe plus qu’à la cinquième place de ce classement.
Les critères de classement de la LMArena
Afin d’évaluer les performances des modèles d’IA de manière impartiale, la LMArena procède à des duels anonymes. Chaque modèle reçoit le même prompt et les utilisateurs choisissent la réponse qu’ils et elles jugent la meilleure. Les résultats sont ensuite convertis en un score Elo : une défaite contre un modèle moins bien noté fait baisser le score, tandis qu’une victoire contre un modèle mieux classé l’augmente. Le classement évolue en temps réel selon ces résultats.