OpenAI présente l’agent ChatGPT, qui peut prendre le contrôle de votre PC
OpenAI présente son nouvel outil d’IA agentique directement intégré à ChatGPT. Voici comment il se présente.
					
				
			
			
				Depuis 2022, l’intelligence artificielle connaît quelques séquences clés : recherche sur le web, canvas, intégration de générateurs d’images, etc. La grande tendance du moment est le développement d’outils d’IA agentique, capables de naviguer sur le web à notre place. Naturellement, OpenAI se veut précurseur en la matière. Pour honorer son statut, la firme lance l’agent ChatGPT. On fait le point !
Les capacités d’Operator dans ChatGPT
« ChatGPT peut désormais travailler pour vous à l’aide de son propre ordinateur virtuel, et gérer des tâches complexes du début à la fin en opérant une évolution fluide entre raisonnement et action », écrit OpenAI en préambule de son communiqué. Pour ce faire, le chatbot intégrera désormais les capacités d’Operator, la technologie d’IA agentique présentée en janvier, combinée aux forces de ChatGPT.
Cela signifie que vous pouvez désormais matérialiser vos idées et questions par des actions concrètes, qu’il s’agisse de mener des recherches financières approfondies, de remplir des formulaires en ligne ou de créer des présentations soignées, souligne OpenAI.
Concrètement, vous pourrez fournir une demande en langage naturel à ChatGPT (par exemple, programmer une réunion dans l’agenda ou rechercher des vols pour un voyage), après quoi ChatGPT s’exécutera, après avoir vérifié les dates en ligne ou comparer les prix. Dans les différents benchmarks présentés, OpenAI précise que l’agent ChatGPT atteint « de nouveaux records » sur le dernier examen de l’humanité ainsi que sur les capacités de modification des feuilles de calcul.
Pour autant, l’agent ChatGPT semble, pour le moment, conçu pour des tâches simples et facilement automatisables. OpenAI ne manque d’ailleurs pas de préciser que « les résultats peuvent sembler rudimentaires en termes de formatage et de finition, en particulier lorsque l’on commence sans document existant ».
Comment fonctionne l’agent ChatGPT
Pour l’utilisateur, tout se passera directement dans ChatGPT. L’agent repose sur un environnement informatique virtuel intégré, capable de gérer des tâches du début à la fin. Pour cela, il utilise un ensemble d’outils spécialisés qu’il choisit en fonction de la tâche à accomplir. Trois canaux principaux sont mobilisés :
- Un navigateur visuel, qui permet à ChatGPT d’interagir avec les sites web comme un humain : cliquer, faire défiler, remplir des formulaires.
 - Un navigateur textuel, optimisé pour des requêtes plus simples où seul le contenu est pertinent, comme extraire une donnée précise ou résumer un article.
 - L’agent peut aussi passer par un accès direct à l’API pour obtenir instantanément des données structurées (financières, sportives, etc.).
 
D’un point de vue visuel, la recherche sur le web s’ouvrira directement sous votre requête, avec l’apparence d’un navigateur maison. L’utilisateur gardera le contrôle total des accès – Operator demandera l’autorisation avant « d’effectuer des actions importantes » – et pourra reprendre la main sur la navigation à tout moment. Par ailleurs, certaines opérations « à haut risque », comme les transactions financières, seront impossibles.
Disponibilité de l’agent ChatGPT
L’agent ChatGPT s’adresse, pour le moment, aux utilisateurs des versions Pro, Plus et Team, avec un élargissement aux plans Enterprise et Education ce mois-ci. À l’exception du plan Pro, pour lequel l’utilisation est « quasi illimitée », la limite des tâches sera fixée à 50 par mois. En revanche, les utilisateurs français devront encore patienter un peu : OpenAI « finalise actuellement la date de lancement de l’agent ChatGPT en France », peut-on lire dans un communiqué envoyé à la presse.
Mais on sait déjà comment s’activera la fonctionnalité : il suffira de cocher le « mode agent », à partir du menu déroulant des outils du compositeur. Il s’agit du menu sous la barre de prompt, au sein duquel on retrouve des outils comme la recherche sur le web ou la génération d’images. Le site affiché dans l’aperçu d’Operator sera fonctionnel pendant 30 jours, après quoi il sera supprimé.