IA : les meilleurs modèles pour le code et le développement web en juin 2026

Toujours dominée par Anthropic, la WebDevArena voit Alibaba revenir en force avec Qwen3.7-max, tandis qu’OpenAI disparaît du top 10.

Classement-webdevarena-juin-2026
Anthropic conserve les meilleures places de la WebDevArena en ce mois de juin 2026. © Capture d'écran BDM

Au gré des sorties de modèles, le classement WebDevArena de LMArena, qui évalue les IA sur les tâches de développement web front-end, ne cesse de se recomposer. Après un mois de mai 2026 placé sous le signe de la mainmise d’Anthropic, l’édition de juin 2026 confirme la domination de la firme américaine sur le terrain du code généré par IA. Elle réserve toutefois deux surprises : le retour d’Alibaba, qui s’invite directement dans le top 5 avec un nouveau modèle, et la sortie pure et simple d’OpenAI du top 10.

Anthropic garde la main, Alibaba refait surface

Sur le segment du développement assisté par IA, Anthropic continue de faire la loi. Les versions « thinking » et standard de Claude Opus 4.7, déployées mi-avril, conservent les deux premières positions, devant Claude Opus 4.6 Thinking (3e). La firme place au total cinq modèles dans le top 10, en y ajoutant Claude Opus 4.6 (5e) et Claude Sonnet 4.6 (7e). Seule perte à signaler de son côté : Claude Opus 4.5, qui quitte le classement, tandis qu’Opus 4.8, sorti tout récemment, ne l’a pas encore intégré.

La principale nouveauté du mois vient d’Alibaba. Avec Qwen3.7-max, l’entreprise chinoise fait son retour dans le haut du tableau en s’emparant directement de la 4e place, devenant au passage le modèle le mieux classé hors écurie Anthropic. Son score reste préliminaire, mais la performance est notable pour un acteur absent non-étatsunien. Alibaba n’est d’ailleurs pas le seul représentant chinois : GLM-5.1 de Z.ai (open source, licence MIT) se maintient en 6e position et Kimi-k2.6 de Moonshot occupe la 8e place, portant à trois le nombre de modèles chinois dans le classement.

Les mouvements sont plus contrastés pour les autres acteurs américains. OpenAI disparaît totalement du top 10 : GPT-5.5 High, qui en occupait encore la dixième position le mois dernier, recule d’un rang. Google, à l’inverse, signe un retour timide grâce à Gemini 3.5 Flash, qui s’installe en 10e place avec un score lui aussi préliminaire. Meta, enfin, conserve sa 9e position avec Muse Spark.

Voici les 10 modèles d’IA les plus performants pour le code et le développement web en juin 2026 :

  1. Claude Opus 4.7 Thinking : 1 567 (score Elo)
  2. Claude Opus 4.7 : 1 562
  3. Claude Opus 4.6 Thinking  : 1 542
  4. Qwen3.7-max (Alibaba) : 1 541
  5. Claude Opus 4.6 : 1 538
  6. GLM-5.1 (Z.ai) : 1 533
  7. Claude Sonnet 4.6 : 1 523
  8. Kimi-k2.6 (Moonshot) : 1 518
  9. Muse Spark (Meta) : 1 508
  10. Gemini 3.5 Flash : 1 506

Accéder au classement complet

Comment fonctionne le classement de la WebDevArena ?

Le principe de la WebDevArena, hérité des autres classements de l’Arena (anciennement LMArena, Chatbot Arena), tient en un mot : le duel. Soumis à une même requête, deux modèles produisent chacun leur réponse, que les internautes comparent sans savoir lequel se cache derrière quelle proposition, avant de désigner la plus convaincante. Ces votes alimentent un score Elo, le système de notation issu des échecs et popularisé dans l’esport. Concrètement, battre un modèle mieux classé fait grimper le score plus vite, tandis qu’une défaite face à un adversaire moins bien noté coûte davantage de points. Un modèle déjà en tête peut continuer de progresser en s’imposant face à des concurrents théoriquement plus faibles, mais sa progression devient alors plus lente. Le classement se recompose ainsi en continu, au fil des votes.

Sujets liés :
Publier un commentaire
Ajouter un commentaire

Votre adresse email ne sera pas publiée.

Visuel enquête Visuel enquête

Nous avons besoin de vous !

Nous réalisons une courte enquête pour comprendre vos besoins et mieux y répondre sur BDM.

Je donne mon avis

Les meilleurs générateurs de code par IA