Claude Opus 4.1 : Anthropic renforce son IA sur les tâches complexes et le code

Anthropic lance Claude Opus 4.1, une mise à jour de son modèle de langage qui améliore les performances en codage, raisonnement et exécution de tâches agentiques.

Claude-Opus-4-1-Anthropic
Le modèle Opus 4.1 de Claude est d'ores et déjà disponible pour les utilisateurs payants et via l'API. © Anthropic

Anthropic a annoncé le lancement de Claude Opus 4.1, une mise à jour de son modèle de langage de pointe. Dévoilée le 5 août 2025, cette nouvelle version vise à renforcer les performances sur les tâches de codage en conditions réelles, le raisonnement multi-étapes et l’exécution d’actions de type agentique. Disponible dès maintenant pour les utilisateurs payants de Claude, Claude Code, mais également via l’API d’Anthropic, Amazon Bedrock et Vertex AI de Google Cloud, Opus 4.1 conserve le même tarif que son prédécesseur.

Un modèle plus performant sur le code en environnement réel

Selon le communiqué d’Anthropic, Claude Opus 4.1 affiche un score de 74,5 % sur SWE-bench Verified, un benchmark de référence pour les tâches de programmation. Ce score dépasse celui de Claude Opus 4 (72,5 %) et confirme une tendance à l’amélioration continue des performances sur des scénarios proches des usages réels. GitHub note notamment une progression significative « en matière de refactorisation de code multifichier ».

Opus 4.1 améliore nos performances de codage de pointe, tout comme les compétences de Claude en recherche approfondie et en analyse de données, notamment en matière de suivi des détails et de recherche d’agents.

La capacité du modèle à identifier des correctifs précis dans de larges bases de code, sans générer de modifications inutiles ni introduire de bugs, semble aussi appréciée. Certains benchmarks observent, avec Opus 4.1, un « gain de performances sensiblement identique à celui de Sonnet 3.7 et Sonnet 4 », ajoute le communiqué d’Anthropic.

Claude-Opus-4-1-benchmark-swe-code
Opus 4.1 montre de belles capacités selon le benchmark SWE-bench Verified. © Anthropic

Un raisonnement approfondi, piloté par réflexion étendue

Au-delà du code, Claude Opus 4.1 introduit des capacités de raisonnement renforcées grâce à une meilleure gestion de la « réflexion étendue », une méthode qui pousse le modèle à expliciter ses chaînes de pensée sur de longues requêtes. Ce mode révèle une meilleure capacité du modèle à raisonner de manière structurée et à résoudre des problèmes complexes nécessitant plusieurs étapes.

claude-opus-4-1-performances
Les performances d’Opus 4.1 face à ses prédécesseurs et ses concurrents. © Anthropic

Anthropic recommande à tous les utilisateurs d’Opus 4 de migrer vers la version 4.1, et aux utilisateurs et utilisatrices de l’API d’opter pour le modèle claude-opus-4-1-20250805. L’entreprise promet par ailleurs des « améliorations substantielles » dans les semaines à venir, confirmant sa volonté de rester à la pointe dans le domaine des IA génératives spécialisées dans le raisonnement et le développement logiciel.

Sujets liés :
Publier un commentaire
Ajouter un commentaire

Votre adresse email ne sera pas publiée.

Visuel enquête Visuel enquête

Community managers : découvrez les résultats de notre enquête 2025

Réseaux, missions, salaire... Un webinar pour tout savoir sur les CM, lundi 29 septembre à 11h !

Je m'inscris

Les meilleurs outils pour les professionnels du web