Anthropic dévoile Claude 4.5 Sonnet, « le meilleur modèle de codage au monde »

Le nouveau modèle de Claude met l’accent sur le code, la polyvalence et la sécurité. Il représente aussi un bond en avant sur le plan agentique.

Pour Anthropic, Claude 4.5 Sonnet représente une avancée considérable sur le plan de l'IA agentique. © Anthropic

Sommaire

Claude enchaîne les modèles à un rythme soutenu. Depuis le début de l’année, Anthropic, son éditeur, avait publié pas moins de 3 modèles : Claude 3.7 Sonnet, Claude 4 Opus & Sonnet et Claude Opus 4.1. En voilà donc un 4e, intitulé Sonnet 4.5. Le nouveau venu intègre notamment des performances améliorées pour les tâches de programmation.

Une nouvelle IA de référence pour le code ?

En toute humilité, Anthropic qualifie Claude Sonnet 4.5 de « meilleur modèle de codage au monde ». L’entreprise met en avant des performances de pointe sur des benchmarks spécialisés comme SWE-bench Verified, qui mesure la capacité d’un modèle à résoudre des problèmes de programmation en conditions réelles. Anthropic indique ainsi que Claude 4.5 parvient à rester concentré et cohérent pendant plus de 30 heures consécutives sur des tâches complexes.

Le code est omniprésent. Il exécute toutes les applications, feuilles de calcul et outils logiciels que vous utilisez. Être capable d’utiliser ces outils et de résoudre des problèmes complexes est la clé du succès du travail moderne. Claude Sonnet 4.5 rend tout cela possible, indique Anthropic.

Anthropic met également en avant deux ajouts pratiques destinés à améliorer l’expérience des développeurs :

Points de contrôle : cette fonction enregistre l’avancée d’un projet et permet de revenir à un état antérieur. Elle offre aux développeurs une sécurité supplémentaire face aux erreurs ou aux expérimentations hasardeuses.
Intégration native dans VS Code : cette nouveauté relie directement Claude Code à l’éditeur le plus utilisé par les programmeurs. Elle facilite le travail quotidien en réduisant les allers-retours entre outils et en renforçant la fluidité du développement.

IA agentique : un outil plus polyvalent pour l’ordinateur

Avec Claude 4.5, Anthropic élargit encore le champ d’action de son modèle. L’entreprise met en avant ses progrès sur OSWorld, un benchmark qui mesure la capacité d’une IA à accomplir des tâches concrètes sur un ordinateur, comme naviguer sur le web, manipuler des tableurs ou gérer des applications. Sur ce terrain, Claude 4.5 atteint 61,4 %, contre 42,2 % pour Sonnet 4 lancé il y a quatre mois à peine.

Plusieurs ajouts renforcent cette polyvalence. L’exécution de code est désormais possible directement dans l’application Claude, ce qui rapproche l’outil de l’usage d’un véritable poste de travail, et l’IA peut créer des fichiers, qu’il s’agisse de documents, de présentations ou de feuilles de calcul. L’extension pour Chrome permet aussi à Claude d’interagir directement avec le navigateur, en offrant la possibilité de naviguer entre différents sites ou de remplir des feuilles de calcul en ligne.

Pour les développeurs, Anthropic propose enfin le SDK Claude Agent. Basé sur l’infrastructure de Claude Code, il permet de concevoir des agents capables de gérer des tâches longues, de coordonner plusieurs sous-agents et de trouver un équilibre entre autonomie et supervision.

Un modèle plus fiable et mieux protégé

Anthropic met en avant des progrès sur le plan de la sécurité. Claude Sonnet 4.5 corrige certains comportements jugés préoccupants, comme la flatterie excessive, la tromperie, la recherche de pouvoir ou encore la propension à encourager des pensées délirantes. Le modèle résiste aussi mieux aux attaques par prompt injection, qui cherchent à détourner son fonctionnement.

L’éditeur a par ailleurs affiné ses filtres de modération, conçus pour bloquer du contenu sensible lié aux armes chimiques, biologiques, radiologiques ou nucléaires. Ils entraînaient parfois des blocages abusifs. Leur précision a donc été renforcée, ce qui réduit nettement le nombre de faux positifs.

Enfin, Claude Sonnet 4.5 est classé au niveau interne de sécurité ASL-3. Pour mieux encadrer son comportement, Anthropic affirme utiliser de nouvelles méthodes d’évaluation, comme l’interprétabilité mécaniste, afin d’anticiper plus finement les dérives possibles du modèle.

contenus non alignés — « Les comportements non alignés incluent (sans s’y limiter) la tromperie, la flagornerie, la recherche de pouvoir, l’encouragement des idées délirantes et l’obéissance aux sollicitations nuisibles du système. » © Anthropic

Claude Sonnet 4.5 est disponible dès maintenant pour tous les utilisateurs, que ce soit via l’API, les applications Claude ou Claude Code. Il remplace directement Sonnet 4 sans surcoût : le tarif reste fixé à 3 $ par million de tokens en entrée et 15 $ par million de tokens en sortie.