ChatGPT lance o3-mini, un modèle moins coûteux pour répondre à DeepSeek

Bousculé par DeepSeek et ses modèles de langages moins coûteux, OpenAI vient à son tour de dévoiler un modèle léger : OpenAI o3-mini. On fait le point !

Deux déclinaisons sont disponibles dans ChatGPT : o3-mini et o3-mini-high. © Capture BDM

Sommaire

Alors que le mois de décembre avait été une séquence maîtrisée pour OpenAI, qui a profité des fêtes de Noël pour annoncer plusieurs nouveautés (Sora, ChatGPT Search, la discussion vidéo…), la firme a été prise de court en ce début d’année 2025 par l’arrivée de DeepSeek. Le nouveau rival chinois a accaparé l’attention en janvier grâce à des modèles capables de rivaliser avec ceux de ChatGPT, tout en étant produits à des coûts largement inférieurs. Mais OpenAI n’entend pas se laisser distancer. Dans un blogpost publié ce vendredi 31 janvier 2025, l’entreprise dirigée par Sam Altman a présenté son nouveau modèle, OpenAI o3-mini, plus léger et moins coûteux.

OpenAI o3-mini : un modèle léger pour concurrencer DeepSeek

Si DeepSeek n’est pas cité une seule fois dans le communiqué, le chatbot reste présent en filigrane. Dès l’introduction, le blog post souligne qu’OpenAI o3-mini est « le modèle le plus récent et le plus rentable » disponible dans ChatGPT et via l’API. S’il ne s’agit pas du premier modèle présenté par OpenAI, o3-mini est le premier à prendre en charge l’appel de fonctions, à générer des sorties structurées et à utiliser les messages développeur. Par ailleurs, les développeurs pourront choisir entre trois niveaux d’effort de raisonnement : low, medium et high.

Dans ChatGPT, la série se décline en deux sous-modèles :

OpenAI o3-mini : modèle rapide, optimisé pour les tâches STEM (sciences, mathématiques, code), avec un effort de raisonnement moyen par défaut.
OpenAI o3-mini-high : version plus avancée d’o3-mini, avec une réflexion plus approfondie au prix d’un temps de réponse légèrement plus long.

o3-mini et o3-mini-high sont d’ores et déjà disponibles pour les utilisateurs de ChatGPT Plus, Team (accès limité) et Pro (accès illimité).

Des résultats à la hauteur des modèles plus lourds

Comme à son habitude, OpenAI présente les résultats des tests de performance dans plusieurs domaines. o3-mini semble en mesure de rivaliser avec les modèles plus lourds d’OpenAI.

Mathématiques avancées : o3-mini atteint des performances comparables à o1-mini avec un faible effort de raisonnement et égale o1 avec un effort moyen. À effort élevé, il surpasse les deux modèles sur des tâches complexes. Sur FrontierMath, lorsqu’il utilise un outil Python, il résout plus de 32 % des problèmes dès la première tentative.
Sciences de niveau doctorat : o3-mini surpasse o1-mini en biologie, chimie et physique. À effort de raisonnement élevé, il dépasse également les performances de o1.
Programmation et ingénierie logicielle : o3-mini excelle en programmation compétitive (Codeforces), développement logiciel (SWEbench-verified) et code appliqué (LiveBench). Il dépasse o1-mini sur toutes ces tâches et rivalise avec o1 sur Codeforces avec un effort moyen.
Connaissances générales et préférences humaines : o3-mini obtient de meilleurs résultats que o1-mini en évaluation des connaissances générales. En outre, les testeurs humains jugent ses réponses plus précises et mieux argumentées.

o3 ChatGPT tests — En sciences de niveau doctorat, o3-mini à haut niveau de raisonnement dépasse o1 et o1-preview. © OpenAI

Deep Research : le prochain agent indépendant d’OpenAI

En parallèle, OpenAI a dévoilé Deep Research, un agent capable de mener des recherches complexes de manière autonome. Intégré à ChatGPT, il analyse et synthétise des centaines de sources en ligne pour produire des rapports détaillés. Conçu pour les professionnels de la finance, de la science et de l’ingénierie, il documente chaque résultat avec des citations précises.

Deep Research est disponible dès aujourd’hui pour les abonnés Pro (200 $ par mois), avec une limite de 100 requêtes mensuelles. Il sera déployé prochainement pour les utilisateurs Plus et Team, puis Entreprise. Cependant, comme souvent, l’accès en Europe pourrait être retardé.