IA : la liste des modèles de langage les plus récents

Les modèles d’IA se font de plus en plus nombreux et il y parfois difficile de s’y retrouver. Dans cet article, vous saurez quels sont les derniers agents conversationnels déployés.

ChatGPT, Gemini, DeepSeek, Claude, Le Chat, mais encore Llama ou Grok : où en sont les principaux modèles d'IA ? © Montage BDM

Sommaire

De nouveaux modèles d’intelligence artificielle sont déployés tous les mois. Entre les nouveaux arrivants qui espèrent frapper un grand coup et des acteurs bien établis, il est parfois difficile de s’y retrouver, dans un écosystème en constante évolution. Découvrez dans cet article les derniers modèles produits par les noms les plus connus de l’IA dédiés à la génération de texte.

OpenAI : ChatGPT et ses déclinaisons

Les modèles sortis en 2025

gpt-5.2 : version optimisée de GPT-5 sortie fin novembre 2025, devant offrir des améliorations significatives en termes de vitesse de traitement et de précision contextuelle. Elle intègre des capacités multimodales renforcées (texte, image, audio) et promet d’exceller dans les tâches nécessitant une compréhension nuancée des instructions complexes et des contextes longs.
gpt-5.1 : mise à jour intermédiaire de GPT-5 déployée en septembre 2025, apportant des correctifs sur la gestion des hallucinations et une meilleure cohérence dans les réponses longues. Cette version est censée affiner les capacités de raisonnement logique et améliorer les performances en analyse de code et en traduction multilingue.
gpt-5 : nouveau modèle phare d’OpenAI sorti début août 2025, décliné en 6 versions pour équilibrer vitesse, coût et profondeur de raisonnement. Plus performant, il réduit les hallucinations, suit mieux les instructions et excelle en rédaction, codage et santé. Il alimente ChatGPT et remplace tous les précédents modèles.
gpt-oss : première gamme open source d’OpenAI depuis 2019, sous licence Apache 2.0. Deux versions : 120B (120 Md de paramètres, proche de o4-mini et au-dessus de o3-mini sur le codage, la santé, les maths) et 20B (20 Md, équivalent à o3-mini mais meilleur en santé et en maths), toutes deux exécutables en local et capables de déléguer certaines tâches au cloud OpenAI.
o3 : modèle de raisonnement avancé capable d’intégrer des images dans son processus de réflexion. Il peut utiliser nativement tous les outils de ChatGPT (navigation web, analyse et génération d’images, etc.). Sorti en avril 2025.
o4-mini : version compacte et rapide du modèle de raisonnement, optimisée pour le coût et la vitesse, tout en conservant de solides performances en mathématiques, codage et analyse visuelle. Sorti en avril 2025.
GPT-4.1 : déclinée en trois variantes accessibles uniquement via l’API, la gamme GPT-4.1, qui excelle en codage, couvre un large spectre d’usages. GPT-4.1 pour les tâches complexes et le traitement de contextes longs, GPT-4.1 mini pour des applications performantes mais allégées, et GPT-4.1 nano pour des tâches simples et rapides, comme l’autocomplétion ou la classification.

GPT-4.5 : modèle grand public le plus avancé d’OpenAI à ce jour, GPT-4.5 bénéficie d’un champ de connaissances plus vaste et d’une compréhension approfondie du monde, se traduisant par des réponses plus fiables et une réduction des hallucinations.
Deep Research : un agent capable de mener des recherches complexes de manière autonome qui, intégré à ChatGPT, analyse et synthétise des centaines de sources en ligne pour produire des rapports détaillés.
o3-mini : version allégée du modèle o3, offrant des capacités de génération de texte avancées avec une empreinte mémoire réduite, ce qui facilite son intégration dans des applications aux ressources limitées.
Operator : modèle d’OpenAI conçu pour des tâches complexes de raisonnement et de planification, améliorant la compréhension contextuelle et la cohérence des réponses générées.

À lire également

ChatGPT : OpenAI confirme l’arrivée de GPT-5 et présente sa feuille de route

Les modèles sortis en 2024

GPT-4o : évolution du célèbre GPT-4, ce modèle phare offre une meilleure compréhension du langage naturel et une génération de texte plus fluide, avec des applications variées allant de l’assistance virtuelle à la création de contenu.
o1 : premier modèle de la série « o » d’OpenAI, axé sur l’amélioration des interactions conversationnelles et la précision des réponses dans divers contextes.

Les modèles sortis en 2023

GPT-4 : successeur de GPT-3.5, ce modèle a amélioré la précision, la cohérence et la compréhension du langage. Il a aussi mieux géré les contextes longs et les tâches complexes. Désormais un ancien modèle, il reste accessible dans ChatGPT pour diverses applications.

Google : Gemini à toutes les sauces

Les modèles sortis en 2025

3 Pro et 3 Flash : nouvelle génération de modèles Gemini lancée en novembre 2025. Gemini 3 Pro se positionne comme le modèle le plus performant de Google, surpassant GPT-5 sur plusieurs benchmarks et excellant en raisonnement complexe, codage et analyse multimodale. Gemini 3 Flash, sa version allégée sortie en décembre, offre des temps de réponse ultra-rapides tout en maintenant des performances élevées, optimisé pour les applications nécessitant un déploiement à grande échelle avec un rapport coût/performance optimal.
2.5 Pro : modèle de raisonnement le plus avancé de Google, capable de traiter des entrées multimodales (texte, image, audio, vidéo) et doté d’un mode « pensée » activé par défaut. Version expérimentale lancée en mars 2025.
2.5 Flash : modèle hybride axé sur la rapidité et l’efficacité, offrant un bon équilibre entre coût et performance. Il intègre un mode de raisonnement activable selon les besoins. Disponible en preview depuis avril 2025.
2.0 Pro Experimental : version expérimentale de Gemini 2.0 Pro, intégrant des fonctionnalités avancées de multimodalité pour traiter simultanément texte, image et audio, offrant une expérience utilisateur enrichie.
2.0 Flash Thinking Experimental : modèle expérimental axé sur la rapidité de génération et la fluidité des réponses, optimisé pour des applications nécessitant des interactions en temps réel.

À lire également

Google booste Gemini : nouvelles versions, IA plus rapide et raisonnement avancé

Les modèles sortis en 2024

1.5 Pro : mise à jour de Gemini 1.0, cette version améliore la précision et la cohérence des réponses, avec une meilleure gestion des contextes complexes.
1.5 Flash : version allégée de Gemini 1.5, optimisée pour des réponses rapides tout en maintenant une qualité de génération élevée.
1.0 Pro : première version professionnelle de Gemini, offrant des capacités de génération de texte robustes pour diverses applications professionnelles.

DeepSeek : le concurrent qui fait peur à OpenAI

Les modèles sortis en 2025

DeepSeek-R1 : modèle de raisonnement avancé du chinois DeepSeek, reconnu pour sa capacité à traiter des tâches complexes avec une compréhension contextuelle approfondie, rivalisant directement avec les leaders du marché.

Les modèles sortis en 2024

DeepSeek-V3 : évolution de la version V2, ce modèle offre une compréhension contextuelle améliorée et une génération de texte plus naturelle, s’adaptant à un large éventail d’applications.
DeepSeek-V2 : deuxième version du modèle phare de la startup chinoise, améliorant la précision et la rapidité des réponses, avec une meilleure gestion des langues et des contextes variés.

À lire également

DeepSeek : 5 choses à savoir sur l’IA chinoise qui concurrence ChatGPT

Anthropic : Claude, un concurrent discret mais performant

Les modèles sortis en 2025

Claude Opus 4.5 : version majeure sortie en novembre 2025, représentant le sommet à ce moment des capacités d’Anthropic en matière de raisonnement complexe et de codage avancé. Ce modèle affiche des performances record sur les benchmarks de programmation et excelle particulièrement dans l’architecture système, le débogage approfondi et la génération de code production-ready. Il intègre une fenêtre de contexte étendue et des capacités agentiques renforcées pour orchestrer des workflows multi-étapes sophistiqués.
Claude Sonnet 4.5 : modèle équilibré lancé en septembre 2025, offrant le meilleur rapport qualité/prix de la gamme Claude 4. Il surpasse Claude 4 Opus sur certains benchmarks tout en restant plus rapide et économique, excellent en analyse de code, rédaction technique et tâches nécessitant un raisonnement structuré. Privilégié pour un usage quotidien professionnel grâce à son efficacité et sa polyvalence.
Claude Opus 4.1 : mise à jour du modèle phare d’Anthropic, optimisée pour le codage en conditions réelles, le raisonnement multi-étapes et l’exécution d’actions agentiques. Plus performant que son prédécesseur sur les benchmarks, il améliore la précision et la structuration des réponses tout en conservant son tarif et sa disponibilité via API et services cloud partenaires.
Claude 4 Sonnet : ce modèle est une amélioration de Claude 3.7 Sonnet sorti en 2024. Plus léger qu’Opus, il est conçu pour offrir « un mélange optimal de capacités et de praticité ».
Claude 4 Opus : « meilleur modèle de codage au monde » selon Anthropic, Claude 4 Opus excelle sur des tâches complexes, longue durée, ou accompagnées d’agents.

Les modèles sortis en 2024

Claude 3.7 Sonnet : modèle avancé d’Anthropic, Claude 3.7 Sonnet est capable d’un raisonnement avancé et d’une réflexion approfondie, avec une auto-analyse de ses réponses. Il est censé exceller dans les tâches de code, les mathématiques, la physique…
Claude 3.5 Sonnet : version améliorée de Claude 3, excellant dans le code, le raisonnement, l’extraction de données visuelles, le tout pour un coût réduit par rapport au modèle précédant..
Claude 3.5 Haiku : version allégée et rapide de la famille Claude 3.5, optimisée pour des tâches nécessitant une réactivité élevée tout en maintenant une compréhension contextuelle approfondie
Claude 3 : troisième itération du modèle Claude, offrant une compréhension linguistique avancée et une génération de texte cohérente pour diverses applications.

Meta : le flou des modèles Llama

Les modèles sortis en 2025

Meta a dévoilé Llama 4, décliné en trois gammes :

Llama 4 Scout : modèle généraliste de 17 milliards de paramètres, conçu pour le traitement de documents, l’analyse de code et l’activité utilisateur, avec une faible consommation de ressources.
Llama 4 Maverick : modèle polyvalent de 17 milliards de paramètres, orienté vers les tâches d’assistance, l’écriture et la compréhension d’images.
Llama 4 Behemoth : modèle en préversion doté de 228 milliards de paramètres, destiné aux usages intensifs en analyse d’images et résolution de problèmes mathématiques.

Les modèles sortis en 2024

Llama 3, 3.1, 3.2 et 3.3 : série de mises à jour successives du modèle Llama, chacune apportant des améliorations en termes de performance, de compréhension contextuelle et de génération de texte, bien que les distinctions précises entre chaque version restent floues.

Alibaba : Qwen dans l’ombre de DeepSeek ?

Les modèles sortis en 2025

Qwen 3 : nouvelle génération de la famille Qwen, introduisant un raisonnement hybride pour alterner entre tâches complexes et réponses rapides, avec une capacité de traitement accrue et une déclinaison de huit modèles.
Qwen 2.5-Max : version avancée de Qwen 2.5, offrant une capacité de traitement accrue et une meilleure adaptation aux contextes complexes, visant à concurrencer les leaders du marché.

Les modèles sortis en 2024

Qwen 2.5 : mise à jour significative du modèle Qwen, améliorant la précision et la fluidité des réponses, avec une intégration optimisée pour les applications professionnelles

À lire également

Hugging Face dévoile Spaces : une plateforme qui intègre 400 000 outils IA à tester

Mistral AI : Le Chat est-il à la hauteur ?

Les modèles sortis en 2025

Ministral : gamme de modèles ultra-compacts lancée en décembre 2025, déclinée en trois versions (3B, 8B, 14B). Conçus pour l’edge computing et le déploiement local, ces modèles offrent des performances remarquables malgré leur taille réduite, excellant en classification, extraction d’informations et tâches spécialisées. Leur faible consommation de ressources les rend idéaux pour les applications mobiles, IoT et environnements contraints.
Mistral Large 3 : modèle phare de Mistral AI sorti en décembre 2025, rivalisant avec GPT-5 et Claude Opus 4 sur les benchmarks de référence. Il excelle en raisonnement complexe, codage avancé et traitement multimodal (texte, image, code), avec une fenêtre de contexte de 128k tokens. Optimisé pour les tâches exigeantes nécessitant précision et créativité, il représente le summum des capacités de l’entreprise française.
Mistral Small 3.1 : basée sur Mistral Small 3, cette itération doit offrir des performances textuelles et de raisonnement accrues, une compréhension multimodale et une fenêtre de contexte étendue, tout en étant assez léger pour fonctionner en local.
Mistral Small 3 : troisième version du modèle compact de Mistral, offrant des performances optimisées pour des applications nécessitant une empreinte mémoire réduite sans sacrifier la qualité.
Mistral Saba : un modèle entraîné sur des données issues du Moyen-Orient et de l’Asie du sud, pour servir des zones géographiques, des marchés et des clients précis.

Les modèles sortis en 2024

Mistral Large, Next et Small : trois modèles de différentes tailles pour Le Chat, offrant des capacités de raisonnement avancé pour le premier, des réponses brèves et concises pour le deuxième, et une version plus économique pour le troisième.
Ministral : version allégée de Mistral, conçue pour des applications embarquées ou des environnements avec des ressources limitées, tout en maintenant une performance acceptable.

xAI : Grok, l’IA estampillée Elon Musk

Les modèles sortis en 2025

Grok 4.1 : version optimisée de Grok 4 déployée en novembre 2025, apportant des améliorations substantielles en « précision factuelle » et en cohérence des raisonnements longs. Cette mise à jour corrige les biais de sur-confiance du modèle précédent et renforce ses capacités multimodales, notamment l’analyse d’images et la génération de graphiques. Grok 4.1 affiche également une latence réduite et une meilleure intégration avec la plateforme X pour l’accès aux données en temps réel.
Grok 4 : dernier modèle conversationnel de xAI, considéré par l’entreprise comme « l’IA la plus intelligente au monde » grâce à un raisonnement logique amélioré et une intégration native d’outils comme la recherche en temps réel
Grok 3 : troisième itération du modèle Grok, intégrant des fonctionnalités avancées de raisonnement et de planification, avec une orientation vers l’autonomie décisionnelle.

Les modèles sortis en 2024

Grok-2 : deuxième version de Grok, améliorant la compréhension contextuelle et la cohérence des réponses, avec une meilleure intégration dans les systèmes existants.
Grok-1.5 : amélioration du premier modèle d’IA de xAI, offrant des améliorations significatives en matière de génération de texte et d’images, avec une intégration étroite à la plateforme X.

Nvidia, le géant discret de l’IA

Le géant de la tech propose plusieurs modèles d’IA, dont certains ont été conçus pour l’IA physique et la robotique, à l’image des modèles Cosmos.

Les modèles sortis en 2025

Basés sur les modèles Llama, les modèles Nemotron ont été améliorés pour des tâches nécessitant un raisonnement complexe, notamment les mathématiques, le codage et la prise de décision. Ils sont disponibles en trois versions :

Llama Nemotron Nano : conçu pour les PC et les dispositifs en périphérie, optimisé pour une utilisation efficace sur des appareils avec des ressources limitées.
Llama Nemotron Super : destiné à offrir une précision et un débit élevés sur un seul GPU, adapté aux centres de données et aux applications nécessitant une performance accrue.
Llama Nemotron Ultra : créé pour les serveurs multi-GPU, offrant une précision maximale pour les tâches de raisonnement les plus exigeantes.

Découvrir d’autres générateurs de texte par IA

Sujets liés :

Publier un commentaire

Ajouter un commentaire

Évaluez BDM

Simple ou compliqué, ennuyeux ou captivant... nous avons besoin de vous pour améliorer notre site. Quelques minutes suffisent !

Je donne mon avis

Les meilleurs outils Visibilité LLM

Meteoria

Visibilité LLM

Une plateforme pour suivre et optimiser la présence dans les IA

ActivGEO by Semactic

Visibilité LLM

Une solution dédiée au suivi de votre présence dans les IA génératives

AreYouMention

Visibilité LLM

Une solution gratuite pour surveiller sa visibilité dans les assistants IA

OpenAI : ChatGPT et ses déclinaisons

Les modèles sortis en 2025

Les modèles sortis en 2024

Les modèles sortis en 2023

Google : Gemini à toutes les sauces

Les modèles sortis en 2025

Les modèles sortis en 2024

DeepSeek : le concurrent qui fait peur à OpenAI

Les modèles sortis en 2025

Les modèles sortis en 2024

Anthropic : Claude, un concurrent discret mais performant

Les modèles sortis en 2025

Les modèles sortis en 2024

Meta : le flou des modèles Llama

Les modèles sortis en 2025

Les modèles sortis en 2024

Alibaba : Qwen dans l’ombre de DeepSeek ?

Les modèles sortis en 2025

Les modèles sortis en 2024

Mistral AI : Le Chat est-il à la hauteur ?

Les modèles sortis en 2025

Les modèles sortis en 2024

xAI : Grok, l’IA estampillée Elon Musk

Les modèles sortis en 2025

Les modèles sortis en 2024

Nvidia, le géant discret de l’IA

Les modèles sortis en 2025

Évaluez BDM

Les meilleurs outils Visibilité LLM

Meteoria

ActivGEO by Semactic

AreYouMention

Sur le même thème

Thèmes populaires