Comment évolue le monde des chatbots et des assistants numériques en 2024 ?

ChatGPT, Gemini, Copilot, Firefly… Comment faire la différence entre tous ces nouveaux outils alimentés par IA ? Réponse en vidéo !

Décryptage du marché de l'IA générative avec Fréderic Cavazza ! © BDM

Chatbots, agents intelligents, assistants numériques… De ChatGPT à Gemini, en passant par Copilot, de nombreux outils ont fait leur apparition sur la toile. Les géants de la tech et leurs challengers mènent une course infernale sur le marché de l’IA, mais à terme, l’intelligence artificielle va-t-elle révolutionner nos usages ? Aujourd’hui, pour nous éclairer sur le sujet, Frédéric Cavazza, consultant et conférencier en transformation numérique, répond à nos questions.

Quelles différences entre les chatbots, les agents intelligents et les assistants numériques ?

Frédéric CAVAZZA – Les chatbots, ce sont des logiciels qui permettent de simuler des conversations. Ça veut dire qu’on pose une question, on a une réponse, ni plus ni moins. Ça, c’est ce que propose ChatGPT, un chatbot (un agent conversationnel en français). Ce que j’appelle les agents intelligents, ce sont des logiciels qui permettent de simuler également des choses, mais qui peuvent faire un petit peu plus que formuler des questions ou des réponses. On peut avoir des agents conversationnels (les chatbots), des agents transactionnels, ceux qui vont réaliser des transactions à votre place, et des agents de recherche, ceux qui vont chercher sur le web ou sur une base de données à votre place. Ce sont des agents que l’on va programmer pour faire des choses à notre place.

Et enfin, on a les assistants numériques. Ce sont un peu les chefs d’orchestre ou les assistants, comme leur nom l’indique, qui vont récupérer des questions et qui vont s’appuyer sur des agents pour pouvoir apporter une réponse ou pour pouvoir apporter satisfaction. C’est là où on va retrouver, par exemple, Siri, Gemini et Copilot. Ce sont des logiciels qui vont récupérer les questions des utilisateurs, qui vont les décomposer et qui vont s’appuyer sur des agents de recherche, transactionnels et conversationnels pour pouvoir répondre aux questions des utilisateurs.

On nous annonce aujourd’hui la révolution de l’intelligence artificielle et notamment la révolution des chatbots, avec des taux d’adoption qui sont censés être très élevés et surtout extrêmement rapides. Je ne dirais pas que je suis pessimiste par rapport à ça, mais je suis plus prudent.

On a un problème qui est celui de l’adoption. Pourquoi ? Parce que ça fait 40 ans que les utilisateurs cliquent sur des boutons, remplissent des formulaires ou cliquent sur des liens. Et là, subitement, on les confronte à des interfaces qui sont très austères. Comme si quelqu’un vous demandait « Qu’est-ce que tu veux ? »  Moi, je ne sais pas répondre à cette question. Je suis un peu sceptique quant à cette adoption rapide et à très grande échelle, on parle de plusieurs milliards d’utilisateurs, qui sont habitués à cliquer sur des boutons et des liens et qui, du jour au lendemain soi-disant, vont se mettre à poser des questions et à dialoguer avec une machine. Non, c’est quelque chose qui n’est pas intuitif. C’est une bascule à laquelle je ne crois pas personnellement. Ça ne va pas se faire en quelques mois, ça ne va même pas se faire en quelques années, ça prendra un peu plus de temps.

Comment est-ce qu’on pourrait faire pour simplifier la prise en main des outils qui reposent sur l’IA générative ?

On peut s’inspirer de ce qui est fait à droite et à gauche. À commencer par exemple par ce que propose Adobe avec Firefly. Adobe propose une interface où on va retrouver des boutons, des options, des fonctions qui sont prédéterminées, c’est quand même un peu plus simple à prendre en main parce qu’on retrouve nos marques.

On a l’exemple d’Apple avec la gamme de fonctionnalités Apple Intelligence qui ne seront pas déployées avant la fin de l’année 2024 ou 2025, mais qui néanmoins est très explicite dans son approche puisqu’eux disent qu’il n’y aura pas de prompt, il n’y aura pas de commande textuelle, il n’y aura que des choix prédéterminés pour simplifier la prise en main. C’est un signal qui est important à prendre en compte, ils prennent le contre-pied complet de toutes les solutions qui existent aujourd’hui, qui reposent sur le prompt. Eux disent non, chez nous, il n’y aura pas de prompt, parce qu’on estime que ce n’est pas viable d’un point de vue ergonomique.

Est-ce que les acteurs historiques comme Google, Apple ou Microsoft sont mieux placés que les startups comme OpenAI ou Anthropic ?

Je pense qu’ils ne sont pas sur le même créneau et surtout ils n’ont pas les mêmes obligations. On a des startups comme OpenAI qui édite ChatGPT ou comme Anthropic qui édite Claude. Ce sont des petites structures, des laboratoires de recherche avec quelques centaines d’employés qui ne sont pas soumis aux mêmes obligations que les géants numériques qui sont cotés en Bourse et qui sont surveillés par les autorités américaines ou européennes avec le DMA et le DSA. En termes de rapidité d’exécution, ce n’est pas la même échelle.

En termes d’offres, on est sur quelque chose de différent. C’est pour ça qu’il était important de faire le distinguo entre chatbot et assistant numérique. Un chatbot, c’est un service en ligne, on y va à travers un navigateur web. On pose des questions, on a des réponses. Ça, c’est ce que propose ChatGPT ou Claude. L’offre de Google, Microsoft ou Apple, ce sont des assistants numériques. Ce sont des outils qui vont s’appuyer sur toutes les ressources disponibles sur un smartphone, une tablette ou un ordinateur. Ce sont des ressources matérielles : les processeurs pour pouvoir faire tourner les modèles en local directement sur les terminales, mais également toutes les informations qui sont sur la machine pour pouvoir contextualiser la demande.

Quand on y réfléchit bien, ils ne sont pas vraiment concurrents, ils ne proposent pas vraiment la même chose. Et on peut les fusionner, puisque dans la future offre d’Apple (Apple Intelligence), on pourra sous-traiter une partie des questions à ChatGPT et rapatrier des réponses au sein de l’environnement d’Apple.

Pour moi, il n’y a pas vraiment de concurrence, simplement les acteurs les plus anciens sont ceux qui sont les mieux ancrés dans le quotidien numérique des utilisateurs, puisque c’est eux qui ont la parfaite maîtrise du matériel sur lequel on va utiliser tous ces outils.

Est-ce que les modèles génératifs ont atteint leurs limites ?

Non, pas du tout. On n’en est qu’au tout début. En fait, tout dépend dans quelle direction on cherche. Si on veut des modèles qui soient encore plus puissants, a priori, il n’y a pas de limites, puisqu’on peut amasser encore plus de données d’entraînement et on peut concevoir des puces qui sont encore plus puissantes pour faire tourner des modèles de plus en plus gros.

Si on cherche, en revanche, dans l’autre sens, des modèles qui soient plus petits, plus rapides, plus économes à faire tourner, là, on a des progrès à faire. Avec des jeux de données d’entraînement qui sont beaucoup plus petits, mais beaucoup plus précis, et avec des puces qui sont optimisées pour pouvoir consommer moins d’énergie.

Sujets liés :
Publier un commentaire
Ajouter un commentaire

Votre adresse email ne sera pas publiée.

Les meilleurs outils pour les professionnels du web