OpenAI dévoile GPT-5.6 Sol, un nouveau modèle réservé aux partenaires approuvés par la Maison-Blanche

OpenAI dévoile sa nouvelle série de modèles intitulée GPT-5.6. Sur demande de l’administration Trump, le lancement est limité à un petit groupe de partenaires américains sélectionnés.

La série GPT-5.6 intégre notamment des améliorations en codage en biologie et en cybersécurité. © VectorGomes - stock.adobe.com

Sommaire

OpenAI vient de dévoiler la série GPT-5.6, qui succède à GPT-5.5 avec des gains affichés en codage, biologie et cybersécurité. Celle-ci est composée de trois modèles : Sol, Terra et Luna. Mais sur demande de l’administration Trump, le lancement est pour l’instant limité à un cercle restreint de partenaires dont la liste a été transmise au gouvernement américain. Une tendance qui pourrait être amenée à se généraliser.

Un nouveau système de nommage et deux modes de raisonnement inédits

Jusqu’ici, OpenAI nommait ses déclinaisons par usage : Thinking, Instant, Cyber. Avec GPT-5.6, la firme passe à un système de capacité : Sol est le plus puissant, Terra le modèle équilibré, Luna la version rapide et économique. Ces noms ont vocation à rester stables d’une génération à l’autre.

Sol est donc le modèle le plus performant d’OpenAI à ce jour. La série introduit deux nouveaux modes de raisonnement : un mode max, qui laisse au modèle plus de temps pour approfondir ses analyses, et un mode ultra, qui mobilise plusieurs sous-agents pour traiter des tâches complexes en parallèle.

ChatGPT et Codex accueilleront prochainement la série, après une phase de prévisualisation réservée à des partenaires sélectionnés. Sol sera également accessible via l’infrastructure Cerebras, avec des vitesses annoncées jusqu’à 750 tokens par seconde, dans un premier temps pour des clients sélectionnés.

Des gains concrets en codage, biologie et cybersécurité

GPT-5.6 Sol affiche des améliorations sur trois domaines par rapport à GPT-5.5 :

Codage : Sol progresse sur des workflows en ligne de commande qui impliquent planification, itérations et coordination d’outils.
Biologie : le modèle traite des analyses génomiques complexes avec moins de tokens que son prédécesseur.
Cybersécurité : Sol affiche des performances proches de Claude Mythos Preview d’Anthropic, tout en consommant environ un tiers des tokens en sortie.

Sur ce dernier point, Sol ne franchit pas le seuil « Cyber Critical » du propre référentiel de sécurité d’OpenAI. « Lors d’évaluations impliquant Chromium et Firefox, il a identifié des bogues et des primitives d’exploitation, mais n’a pas produit de manière autonome une exploitation complète et fonctionnelle dans les conditions testées », justifie OpenAI. Toutefois, « les seuils de référence ne peuvent pas couvrir toutes les utilisations possibles d’un modèle ni toutes les combinaisons possibles avec d’autres outils », rappelle la firme. Un risque qui explique, selon elle, les mesures de protection renforcées et la publication progressive des modèles, qui n’est disponible que pour une poignée de partenaires. Mais la décision semble surtout contrainte par la Maison-Blanche.

Le gouvernement américain s’impose comme arbitre des lancements IA

Avant le lancement, OpenAI a présenté ses modèles à l’administration Trump, et c’est à sa demande que la diffusion reste limitée dans un premier temps. La firme indique travailler conjointement avec l’exécutif, mais tente toutefois de rassurer sur sa position : ce type de processus « ne devrait pas devenir la norme à long terme », car « il prive les utilisateurs, les développeurs, les entreprises, les experts en cybersécurité et nos partenaires internationaux des meilleurs outils ». Toujours est-il qu’OpenAI ne semble pas avoir opposé de grande résistance face à Washington, qui entend, de son côté, généraliser ce type de contrôle.

Intrépide, OpenAI affirme :
Nous prenons cette mesure à court terme car nous pensons qu’il s’agit de la voie la plus sûre vers une disponibilité plus large dans les semaines à venir, pendant que nous travaillons avec l’Administration à l’élaboration du cadre du décret présidentiel relatif à la cybersécurité et d’un processus reproductible pour les futures diffusions de modèles.

Il y a quelques semaines, le gouvernement avait déjà contraint Anthropic à désactiver l’accès à Claude Mythos 5 et Claude Fable 5 pour l’ensemble de sa clientèle, invoquant des préoccupations liées à la cybersécurité et à l’accès potentiel de la Chine au modèle. Après deux semaines de négociations, l’administration a partiellement levé la restriction et autorisé Anthropic à redéployer Mythos 5 auprès de plus de 100 institutions américaines. Mais à cette heure, Fable 5 reste toujours désactivé.

Sujets liés :