Claude présente une nouvelle option pour contrôler votre ordinateur grâce à l’IA
Anthropic met à jour Claude 3.5 Sonnet, qui peut désormais réaliser des tâches de manière autonome sur PC et Mac. Claude 3.5 Haiku, plus rapide, fait également son arrivée.
Dans le domaine de l’IA générative, Anthropic est une entreprise qui innove. Après avoir lancé les Artefacts sur Claude en juin, une fonctionnalité depuis copiée par ChatGPT, la société ajoute une nouvelle capacité inédite à son agent conversationnel : le contrôle de l’ordinateur personnel. En complément de cette annonce, qui s’intègre dans le cadre d’une mise à jour de Claude 3.5 Sonnet, Anthropic présente son nouveau modèle de langage : Claude 3.5 Haiku. Tour d’horizon des nouveautés.
Claude 3.5 Sonnet : contrôle du PC et meilleures capacités en code
Dans un blog post publié ce mardi 22 octobre 2024, Anthropic dévoile une mise à jour majeure de Claude 3.5 Sonnet, son modèle de langage le plus performant. Il intègre deux principales nouveautés : le contrôle du PC par IA et des capacités améliorées en code.
Claude peut désormais contrôler votre PC
L’actualisation de Claude 3.5 Sonnet introduit une option particulièrement innovante : la capacité à réaliser des tâches de manière autonome sur PC. Cette fonctionnalité, disponible en bêta publique sur l’API, permet de déléguer des tâches à l’IA sur votre ordinateur à l’aide d’une simple requête textuelle.
Les développeurs peuvent demander à Claude d’utiliser les ordinateurs comme le font les gens, en regardant un écran, en déplaçant un curseur, en cliquant sur des boutons et en tapant du texte, précise Anthropic dans le communiqué.
Dans l’exemple présenté en vidéo (voir ci-dessous), l’utilisateur demande à l’IA de remplir un formulaire en ligne en utilisant les données présentes sur un tableur. Après avoir scanné l’écran, Claude comprend que le tableur n’est en réalité pas le bon et effectue une recherche en ligne pour trouver les informations souhaitées, avant de remplir le formulaire.
Toutefois, Claude précise que l’outil est encore en phase expérimentale, « parfois lourd et sujet aux erreurs ». Dans la vidéo, l’ensemble des éléments nécessaires pour effectuer la tâche est en effet déjà ouvert sur le bureau, ce qui laisse supposer des lacunes de Claude 3.5 Sonnet pour trouver lui-même des informations. L’option semble également afficher une certaine lenteur dans l’exécution des tâches.
Des capacités améliorées en code
La mise à jour de Claude 3.5 Sonnet permet également au modèle d’améliorer ses capacités générales. Selon Anthropic, ses compétences en code, en particulier, se retrouvent décuplées. Sur le SWE-bench Verified, outil de mesure développé par OpenAI pour évaluer les performances dans les tâches complexes de développement logiciel, Claude 3.5 Sonnet a amélioré sa précision, passant de 33,4 % à 49 %. Un score qui dépasse désormais celui affiché par OpenAI o1-preview.
Une avancée qui, selon Anthropic, a été soulignée par de nombreux primo-utilisateurs : « GitLab, qui a testé le modèle pour des tâches DevSecOps, a constaté qu’il permettait un meilleur raisonnement (jusqu’à 10 % selon les cas d’utilisation) sans latence supplémentaire. […] The Browser Company, en utilisant le modèle pour automatiser les flux de travail sur le web, a noté que Claude 3.5 Sonnet surpassait tous les modèles testés auparavant », précise la firme.
Claude 3.5 Haiku : un nouveau modèle qui met l’accent sur l’efficacité
Claude 3.5 Haiku est le successeur de Claude 3 Haiku, dévoilé en mars dernier. Les modèles Haiku sont plus compacts et plus rapides, conçus pour les tâches légères nécessitant une réponse instantanée. Claude 3.5 Haiku présente, tout comme Claude 3.5 Sonnet, des capacités améliorées dans les tâches de code (il obtient un score de 40,6 % au SWE-bench Verified), tout en affichant un temps de réaction réduit et un meilleur suivi des instructions. Anthropic précise que le modèle est adapté « aux produits en contact avec les utilisateurs, aux tâches spécialisées des sous-agents et à la génération d’expériences personnalisées à partir d’énormes volumes de données comme l’historique des achats, les prix ou les enregistrements d’inventaire ». Claude 3.5 Haiku sera disponible dans les prochaines semaines via l’API.
Community managers : découvrez les résultats de notre enquête 2025
Réseaux, missions, salaire... Un webinar pour tout savoir sur les CM, lundi 29 septembre à 11h !
Je m'inscris