Definition Intelligence artificielle générale (AGI)

L’intelligence artificielle générale, aussi désignée par son acronyme anglais AGI (Artificial General Intelligence) ou IAG en français, décrit une forme d’intelligence artificielle capable d’effectuer n’importe quelle tâche cognitive qu’un être humain peut accomplir : raisonnement abstrait, apprentissage dans un domaine inconnu, transfert de connaissances d’un contexte à un autre, résolution de problèmes ouverts sans entraînement préalable spécifique. Elle s’oppose à l’IA dite « faible » ou « étroite », qui désigne les systèmes actuels (LLM, modèles de reconnaissance d’images, moteurs de recommandation) spécialisés dans une tâche précise et incapables de généraliser hors de leur domaine d’entraînement.

La définition exacte de l’AGI fait l’objet de désaccords profonds dans la communauté scientifique. Certains chercheurs l’associent à la conscience ou à l’intentionnalité ; d’autres la définissent de façon plus opérationnelle, comme la capacité à obtenir des performances humaines ou supérieures sur un ensemble suffisamment large et varié de benchmarks cognitifs. Sam Altman, PDG d’OpenAI, considérait en 2025 que les systèmes existants surpassaient déjà l’intelligence humaine dans certains domaines. Yann LeCun, de son côté, estime que les LLM actuels sont fondamentalement une impasse vers l’AGI, faute de modèles du monde, de causalité et de raisonnement véritable.

Sur le plan institutionnel, OpenAI définit l’AGI dans ses statuts comme un « système d’IA hautement autonome qui surpasse les humains dans la plupart des tâches économiquement utiles ». Anthropic et DeepMind utilisent des formulations différentes. L’absence de définition partagée complique aussi bien la mesure des progrès que l’élaboration de cadres réglementaires.

World models : un pas vers l'AGI ?

Les LLM actuels simulent la compréhension du monde sans la posséder réellement. À l’inverse, les world models cherchent à modéliser les règles physiques et la causalité du monde réel. Ils sont présentés par certains chercheurs comme une voie possible vers l’AGI. Emmanuelle Guyot, Head of Data Science chez Hellowork, l’illustre ainsi : « Un LLM a entendu dans des textes que quand on lâche un objet, il tombe par terre, donc il connaît la gravité de cette manière. Alors qu’un world model, lui, va vraiment comprendre physiquement le concept de gravité. »

AGI et superintelligence : deux concepts distincts

L’AGI est souvent confondue avec la superintelligence, qui désigne un niveau supérieur : une IA qui surpasserait les capacités cognitives humaines dans tous les domaines, et pas seulement dans certains d’entre eux. L’AGI correspond au seuil de parité avec l’humain, la superintelligence correspond au dépassement de ce seuil. Nick Bostrom, philosophe à l’Université d’Oxford, a formalisé cette distinction dans son livre Superintelligence (2014), qui a largement contribué à structurer le débat public sur les risques liés à l’IA.

Demis Hassabis, directeur de Google DeepMind, estimait en 2025 qu’une AGI pourrait voir le jour aux alentours de 2030. Sam Altman la situait dans « quelques milliers de jours ». Ces projections sont contestées par une partie des chercheurs, qui soulignent que les avancées récentes des LLM  ne résolvent pas les obstacles fondamentaux : absence de raisonnement causal, incapacité à apprendre de façon continue sans réentraînement, manque d’ancrage dans le monde physique.

AGI : enjeux pour les entreprises et la régulation

Le test de Turing, proposé par Alan Turing en 1950, posait une question opérationnelle : une machine peut-elle produire des réponses conversationnelles indiscernables de celles d’un humain ? Pendant des décennies, ce critère a servi de référence implicite pour évaluer l’intelligence des machines. Il est aujourd’hui largement considéré comme insuffisant pour qualifier l’AGI : les LLM actuels réussissent des variantes du test de Turing sans pour autant raisonner, planifier ou comprendre le monde physique.

Des chercheurs ont proposé des critères de remplacement. François Chollet, ingénieur chez Google, a développé l’ARC-AGI (Abstraction and Reasoning Corpus), un benchmark conçu pour évaluer la capacité d’un système à résoudre des problèmes de raisonnement abstraits à partir d’un minimum d’exemples. Une compétence que les humains maîtrisent naturellement mais que les LLM peinent à reproduire sans entraînement massif. En 2024, les meilleurs modèles atteignaient environ 50 % de réussite sur ARC-AGI alors le score humain moyen dépasse 85 %.