Anthropic déploie Claude Opus 4.7 : ce qui change par rapport au précédent modèle

Deux mois après Opus 4.6, Anthropic pousse un nouveau modèle qui améliore la vision, le suivi d’instructions et les protections en cybersécurité.

Anthropic veut conserver sa longueur d'avance sur la concurrence et déploie Claude Opus 4.7, son tout dernier modèle. © Anthropic

Anthropic ne lâche rien dans la course à l’IA la plus performante. Deux mois après les sorties d’Opus 4.6 et de Sonnet 4.6, et une semaine après avoir dévoilé Claude Mythos Preview, un modèle jugé trop dangereux pour être rendu public, la firme présente Claude Opus 4.7. Ce nouveau modèle, déjà disponible sur Claude, l’API et les principales plateformes cloud, mise sur une vision améliorée, une meilleure autonomie sur les tâches longues et de nouveaux garde-fous en matière de cybersécurité.

Claude Opus 4.7 voit mieux, suit mieux les instructions et travaille plus longtemps

L’amélioration la plus visible de Claude Opus 4.7 concerne la vision. Le modèle accepte désormais des images jusqu’à 2 576 pixels sur le bord long (environ 3,75 mégapixels), soit plus de trois fois la résolution des modèles précédents. Cette évolution profite notamment aux agents IA agissant directement sur ordinateur, qui doivent lire des captures d’écran denses. Elle bénéficie également aux tâches d’extraction de données depuis des diagrammes complexes ou de travail à partir de maquettes haute fidélité.

Pour ce qui est du développement, Anthropic présente Opus 4.7 comme une amélioration notable sur les tâches complexes et de longue durée. Le modèle « gère les tâches complexes avec rigueur et constance, suit les instructions avec précision et trouve des moyens de vérifier ses propres résultats avant de les soumettre », indique l’entreprise. Il serait également « plus créatif et plus soigné » dans la production d’interfaces, de présentations et de documents.

Précisions sur le suivi d'instructions

Le suivi d’instructions a suffisamment progressé pour qu’Anthropic émette une mise en garde : les prompts écrits pour des modèles antérieurs peuvent désormais produire des résultats inattendus, le modèle les interprétant de manière plus littérale. L’entreprise recommande donc aux développeurs et développeuses de réajuster leurs prompts en conséquence.

À noter que, d’après les benchmarks publiés par Anthropic, Opus 4.7 reste en deçà de Claude Mythos Preview, que la firme présente comme son modèle le plus puissant, mais surpasse Opus 4.6 sur l’ensemble des tests. Les tarifs restent quant à eux inchangés : 5 dollars par million de tokens en entrée et 25 dollars en sortie. Le modèle est disponible sur Claude, l’API, Amazon Bedrock, Vertex AI de Google Cloud et Microsoft Foundry.

benchmark-opus-4-7 — Plus performant qu’Opus 4.6, cette nouvelle version grand public semble bien en deçà des capacités attribuées au modèle Mythos. © Anthropic

Migration depuis Opus 4.6 : une consommation de tokens à surveiller

Anthropic prévient que la migration depuis Opus 4.6 peut affecter la consommation de tokens. Le nouveau tokenizer fait qu’un même texte en entrée peut mobiliser jusqu’à 1,35 fois plus de tokens qu’auparavant. En parallèle, le modèle raisonne davantage aux niveaux d’effort élevés, ce qui augmente le volume de tokens en sortie. Anthropic indique que l’effet net reste favorable dans ses tests internes, mais recommande de mesurer l’impact sur du trafic réel. Un guide de migration est disponible dans la documentation.

Des garde-fous cyber hérités de Project Glasswing

L’autre axe structurant de Claude Opus 4.7 concerne la cybersécurité. La semaine dernière, Anthropic avait présenté Project Glasswing, une initiative de cyberdéfense visant à déployer Mythos Preview auprès d’une cinquantaine d’organisations partenaires (AWS, Apple, Microsoft, CrowdStrike, Linux Foundation) pour sécuriser des infrastructures logicielles critiques.

Opus 4.7 s’inscrit dans la continuité de cette démarche. Anthropic indique avoir « expérimenté des efforts pour réduire de manière ciblée » les capacités cyber du modèle par rapport à Mythos Preview. Le modèle embarque des garde-fous automatisés conçus pour « détecter et bloquer les requêtes qui indiquent des usages cybernétiques interdits ou à haut risque », précise la firme. Ce dispositif constitue un premier terrain d’expérimentation, les enseignements tirés de son déploiement devant guider, à terme, la mise à disposition de modèles de la gamme Mythos au grand public.

Les professionnels de la sécurité souhaitant utiliser Opus 4.7 à des fins légitimes (recherche de vulnérabilités, tests d’intrusion, red-teaming) peuvent rejoindre le Cyber Verification Program, un nouveau programme de vérification mis en place par Anthropic.

Les autres nouveautés lancées avec Opus 4.7

Anthropic déploie plusieurs fonctionnalités annexes en parallèle du nouveau modèle :

Un nouveau niveau d’effort « xhigh » (entre « high » et « max ») pour un contrôle plus fin du raisonnement via l’API,
La commande /ultrareview dans Claude Code, qui produit une session de revue dédiée pour repérer bugs et problèmes de conception,
Les task budgets en bêta publique sur l’API, pour guider la consommation de tokens sur les tâches longues,
L’extension de l’auto mode aux abonnés Max dans Claude Code, pour exécuter des tâches longues sans interruption