IA : la liste des modèles de langage les plus récents

Les modèles d’IA se font de plus en plus nombreux et il y parfois difficile de s’y retrouver. Dans cet article, vous saurez quels sont les derniers agents conversationnels déployés.

visuel-une-selection-outils – Catalogue-IA-generative-texte
ChatGPT, Gemini, DeepSeek, Claude, Le Chat, mais encore Llama ou Grok : où en sont les principaux modèles d'IA ? © Montage BDM

De nouveaux modèles d’intelligence artificielle sont déployés tous les mois. Entre les nouveaux arrivants qui espèrent frapper un grand coup et des acteurs bien établis, il est parfois difficile de s’y retrouver, dans un écosystème en constante évolution. Découvrez dans cet article les derniers modèles produits par les noms les plus connus de l’IA dédiés à la génération de texte.

OpenAI : ChatGPT et ses déclinaisons

Les modèles sortis en 2025

  • gpt-5 : nouveau modèle phare d’OpenAI sorti début août 2025, décliné en 6 versions pour équilibrer vitesse, coût et profondeur de raisonnement. Plus performant, il réduit les hallucinations, suit mieux les instructions et excelle en rédaction, codage et santé. Il alimente ChatGPT et remplace tous les précédents modèles.
  • gpt-oss : première gamme open source d’OpenAI depuis 2019, sous licence Apache 2.0. Deux versions : 120B (120 Md de paramètres, proche de o4-mini et au-dessus de o3-mini sur le codage, la santé, les maths) et 20B (20 Md, équivalent à o3-mini mais meilleur en santé et en maths), toutes deux exécutables en local et capables de déléguer certaines tâches au cloud OpenAI.
  • o3 : modèle de raisonnement avancé capable d’intégrer des images dans son processus de réflexion. Il peut utiliser nativement tous les outils de ChatGPT (navigation web, analyse et génération d’images, etc.). Sorti en avril 2025. ​
  • o4-mini : version compacte et rapide du modèle de raisonnement, optimisée pour le coût et la vitesse, tout en conservant de solides performances en mathématiques, codage et analyse visuelle. Sorti en avril 2025.
  • GPT-4.1 : déclinée en trois variantes accessibles uniquement via l’API, la gamme GPT-4.1, qui excelle en codage, couvre un large spectre d’usages. GPT-4.1 pour les tâches complexes et le traitement de contextes longs, GPT-4.1 mini pour des applications performantes mais allégées, et GPT-4.1 nano pour des tâches simples et rapides, comme l’autocomplétion ou la classification.
  • GPT-4.5 : modèle grand public le plus avancé d’OpenAI à ce jour, GPT-4.5 bénéficie d’un champ de connaissances plus vaste et d’une compréhension approfondie du monde, se traduisant par des réponses plus fiables et une réduction des hallucinations.
  • Deep Research : un agent capable de mener des recherches complexes de manière autonome qui, intégré à ChatGPT, analyse et synthétise des centaines de sources en ligne pour produire des rapports détaillés.
  • o3-mini : version allégée du modèle o3, offrant des capacités de génération de texte avancées avec une empreinte mémoire réduite, ce qui facilite son intégration dans des applications aux ressources limitées.
  • Operator : modèle d’OpenAI conçu pour des tâches complexes de raisonnement et de planification, améliorant la compréhension contextuelle et la cohérence des réponses générées.

Les modèles sortis en 2024

  • GPT-4o : évolution du célèbre GPT-4, ce modèle phare offre une meilleure compréhension du langage naturel et une génération de texte plus fluide, avec des applications variées allant de l’assistance virtuelle à la création de contenu.
  • o1 : premier modèle de la série « o » d’OpenAI, axé sur l’amélioration des interactions conversationnelles et la précision des réponses dans divers contextes.

Les modèles sortis en 2023

  • GPT-4 : successeur de GPT-3.5, ce modèle a amélioré la précision, la cohérence et la compréhension du langage. Il a aussi mieux géré les contextes longs et les tâches complexes. Désormais un ancien modèle, il reste accessible dans ChatGPT pour diverses applications.

Google : Gemini à toutes les sauces

Les modèles sortis en 2025

  • 2.5 Pro : modèle de raisonnement le plus avancé de Google, capable de traiter des entrées multimodales (texte, image, audio, vidéo) et doté d’un mode « pensée » activé par défaut. Version expérimentale lancée en mars 2025. ​
  • 2.5 Flash : modèle hybride axé sur la rapidité et l’efficacité, offrant un bon équilibre entre coût et performance. Il intègre un mode de raisonnement activable selon les besoins. Disponible en preview depuis avril 2025.
  • 2.0 Pro Experimental : version expérimentale de Gemini 2.0 Pro, intégrant des fonctionnalités avancées de multimodalité pour traiter simultanément texte, image et audio, offrant une expérience utilisateur enrichie.
  • 2.0 Flash Thinking Experimental : modèle expérimental axé sur la rapidité de génération et la fluidité des réponses, optimisé pour des applications nécessitant des interactions en temps réel.

Les modèles sortis en 2024

  • 1.5 Pro : mise à jour de Gemini 1.0, cette version améliore la précision et la cohérence des réponses, avec une meilleure gestion des contextes complexes.
  • 1.5 Flash : version allégée de Gemini 1.5, optimisée pour des réponses rapides tout en maintenant une qualité de génération élevée.
  • 1.0 Pro : première version professionnelle de Gemini, offrant des capacités de génération de texte robustes pour diverses applications professionnelles.

DeepSeek : le concurrent qui fait peur à OpenAI

Les modèles sortis en 2025

  • DeepSeek-R1 : modèle de raisonnement avancé du chinois DeepSeek, reconnu pour sa capacité à traiter des tâches complexes avec une compréhension contextuelle approfondie, rivalisant directement avec les leaders du marché.

Les modèles sortis en 2024

  • DeepSeek-V3 : évolution de la version V2, ce modèle offre une compréhension contextuelle améliorée et une génération de texte plus naturelle, s’adaptant à un large éventail d’applications.
  • DeepSeek-V2 : deuxième version du modèle phare de la startup chinoise, améliorant la précision et la rapidité des réponses, avec une meilleure gestion des langues et des contextes variés.

Anthropic : Claude, un concurrent discret mais performant

Les modèles sortis en 2025

  • Claude Opus 4.1 : mise à jour du modèle phare d’Anthropic, optimisée pour le codage en conditions réelles, le raisonnement multi-étapes et l’exécution d’actions agentiques. Plus performant que son prédécesseur sur les benchmarks, il améliore la précision et la structuration des réponses tout en conservant son tarif et sa disponibilité via API et services cloud partenaires.
  • Claude 4 Sonnet : ce modèle est une amélioration de Claude 3.7 Sonnet sorti en 2024. Plus léger qu’Opus, il est conçu pour offrir « un mélange optimal de capacités et de praticité ».
  • Claude 4 Opus : « meilleur modèle de codage au monde » selon Anthropic, Claude 4 Opus excelle sur des tâches complexes, longue durée, ou accompagnées d’agents.

Les modèles sortis en 2024

  • Claude 3.7 Sonnet : modèle avancé d’Anthropic, Claude 3.7 Sonnet est capable d’un raisonnement avancé et d’une réflexion approfondie, avec une auto-analyse de ses réponses. Il est censé exceller dans les tâches de code, les mathématiques, la physique…
  • Claude 3.5 Sonnet : version améliorée de Claude 3, excellant dans le code, le raisonnement, l’extraction de données visuelles, le tout pour un coût réduit par rapport au modèle précédant..
  • Claude 3.5 Haiku : version allégée et rapide de la famille Claude 3.5, optimisée pour des tâches nécessitant une réactivité élevée tout en maintenant une compréhension contextuelle approfondie
  • Claude 3 : troisième itération du modèle Claude, offrant une compréhension linguistique avancée et une génération de texte cohérente pour diverses applications.

Meta : le flou des modèles Llama

Les modèles sortis en 2025

Meta a dévoilé Llama 4, décliné en trois gammes :

  • Llama 4 Scout : modèle généraliste de 17 milliards de paramètres, conçu pour le traitement de documents, l’analyse de code et l’activité utilisateur, avec une faible consommation de ressources.
  • Llama 4 Maverick : modèle polyvalent de 17 milliards de paramètres, orienté vers les tâches d’assistance, l’écriture et la compréhension d’images.
  • Llama 4 Behemoth : modèle en préversion doté de 228 milliards de paramètres, destiné aux usages intensifs en analyse d’images et résolution de problèmes mathématiques.

Les modèles sortis en 2024

  • Llama 3, 3.1, 3.2 et 3.3 : série de mises à jour successives du modèle Llama, chacune apportant des améliorations en termes de performance, de compréhension contextuelle et de génération de texte, bien que les distinctions précises entre chaque version restent floues.

Alibaba : Qwen dans l’ombre de DeepSeek ?

Les modèles sortis en 2025

  • Qwen 3 : nouvelle génération de la famille Qwen, introduisant un raisonnement hybride pour alterner entre tâches complexes et réponses rapides, avec une capacité de traitement accrue et une déclinaison de huit modèles.
  • Qwen 2.5-Max : version avancée de Qwen 2.5, offrant une capacité de traitement accrue et une meilleure adaptation aux contextes complexes, visant à concurrencer les leaders du marché.

Les modèles sortis en 2024

  • Qwen 2.5 : mise à jour significative du modèle Qwen, améliorant la précision et la fluidité des réponses, avec une intégration optimisée pour les applications professionnelles

Mistral AI : Le Chat est-il à la hauteur ?

Les modèles sortis en 2025

  • Mistral Small 3.1 : basée sur Mistral Small 3, cette itération doit offrir des performances textuelles et de raisonnement accrues, une compréhension multimodale et une fenêtre de contexte étendue, tout en étant assez léger pour fonctionner en local.
  • Mistral Small 3 : troisième version du modèle compact de Mistral, offrant des performances optimisées pour des applications nécessitant une empreinte mémoire réduite sans sacrifier la qualité.
  • Mistral Saba : un modèle entraîné sur des données issues du Moyen-Orient et de l’Asie du sud, pour servir des zones géographiques, des marchés et des clients précis.

Les modèles sortis en 2024

  • Mistral Large, Next et Small : trois modèles de différentes tailles pour Le Chat, offrant des capacités de raisonnement avancé pour le premier, des réponses brèves et concises pour le deuxième, et une version plus économique pour le troisième.
  • Ministral : version allégée de Mistral, conçue pour des applications embarquées ou des environnements avec des ressources limitées, tout en maintenant une performance acceptable.

xAI : Grok, l’IA estampillée Elon Musk

Les modèles sortis en 2025

  • Grok 4 : dernier modèle conversationnel de xAI, considéré par l’entreprise comme « l’IA la plus intelligente au monde » grâce à un raisonnement logique amélioré et une intégration native d’outils comme la recherche en temps réel
  • Grok-3 : troisième itération du modèle Grok, intégrant des fonctionnalités avancées de raisonnement et de planification, avec une orientation vers l’autonomie décisionnelle.

Les modèles sortis en 2024

  • Grok-2 : deuxième version de Grok, améliorant la compréhension contextuelle et la cohérence des réponses, avec une meilleure intégration dans les systèmes existants.
  • Grok-1.5 : amélioration du premier modèle d’IA de xAI, offrant des améliorations significatives en matière de génération de texte et d’images, avec une intégration étroite à la plateforme X.

Nvidia, le géant discret de l’IA

Le géant de la tech propose plusieurs modèles d’IA, dont certains ont été conçus pour l’IA physique et la robotique, à l’image des modèles Cosmos.

Les modèles sortis en 2025

Basés sur les modèles Llama, les modèles Nemotron ont été améliorés pour des tâches nécessitant un raisonnement complexe, notamment les mathématiques, le codage et la prise de décision. Ils sont disponibles en trois versions :

  • Llama Nemotron Nano : conçu pour les PC et les dispositifs en périphérie, optimisé pour une utilisation efficace sur des appareils avec des ressources limitées.​
  • Llama Nemotron Super : destiné à offrir une précision et un débit élevés sur un seul GPU, adapté aux centres de données et aux applications nécessitant une performance accrue.​
  • Llama Nemotron Ultra : créé pour les serveurs multi-GPU, offrant une précision maximale pour les tâches de raisonnement les plus exigeantes.

Découvrir d’autres générateurs de texte par IA

Sujets liés :
Publier un commentaire
Ajouter un commentaire

Votre adresse email ne sera pas publiée.

Visuel enquête Visuel enquête

Community managers : découvrez les résultats de notre enquête 2025

Réseaux, missions, salaire... Un webinar pour tout savoir sur les CM, lundi 29 septembre à 11h !

Je m'inscris

Les meilleurs outils pour les professionnels du web