Mistral AI lance Small 3 : un nouveau modèle plus léger en réponse à DeepSeek

Mistral AI a déployé Small 3, un modèle que l’entreprise française annonce comme le plus efficace de sa catégorie.

SMALL-3-Mistral
Mistral entend bien concurrencer DeepSeek avec Small 3. © Rafael Henrique - stock.adobe.com

Ce jeudi 30 janvier, Mistral AI a publié un blog post pour annoncer le déploiement de Small 3, un modèle open source et optimisé pour la latence. Avec ses 24 milliards de paramètres, ce nouveau modèle est présenté comme compétitif par rapport à d’autres LLM comme Llama 3.3 70B de Meta et Qwen-2.5 32B d’Alibaba.

Une alternative locale et open source

La start-up française ne comptait pas se laisser faire sur le marché des modèles open source avec l’arrivée en trombe de DeepSeek. Small 3 est donc très efficace malgré sa petite taille. Il obtient d’ailleurs de très bons résultats dans de nombreux domaines et est – à en croire les tests dévoilés par la marque – souvent supérieur à d’autres petits modèles comme Gemma 2, Qwen 2.5 ou encore GPT-4o-mini.

Mistral Small 3
Nous constatons ici que Small 3 est bien supérieur à Gemma 2 et concurrence Llamma 3.3 et GPT-4o-mini. © Mistral AI

Une des principales forces de Mistral Small 3 réside dans sa capacité à fonctionner en local sur des machines relativement standards, comme un PC avec une carte graphique Nvidia RTX 4090 ou un Mac Book avec 32 Go de RAM. Mistral recommande d’utiliser Small 3 dans des scénarios où des réponses rapides et précises sont essentielles.

Un outil pour concurrencer DeepSeek

Mistral semble privilégier avant tout la rapidité, l’efficacité et la faible consommation en ressources plutôt que la simple quête de performances. C’est dans cette logique que l’entreprise lance Small 3, un modèle conçu pour s’imposer comme une alternative européenne aux acteurs américains et chinois dominants du secteur de l’IA générative. Mistral assume d’ailleurs pleinement cette ambition.

En conclusion de son communiqué, l’entreprise annonce que « Mistral Small 3 complète les grands modèles de raisonnement open source comme les versions récentes de DeepSeek, et peut servir de modèle de base solide pour faire émerger des capacités de raisonnement ». La start-up française annonce également que de nouveaux modèles Mistral « petits et grands dotés de capacités de raisonnement améliorées » devraient voir le jour dans les prochaines semaines.

Sujets liés :
Publier un commentaire
Ajouter un commentaire

Votre adresse email ne sera pas publiée.

Visuel enquête Visuel enquête

Community managers : découvrez les résultats de notre enquête 2025

Réseaux, missions, salaire... Un webinar pour tout savoir sur les CM, lundi 29 septembre à 11h !

Je m'inscris

Les meilleurs outils pour les professionnels du web