Les robots n’ont pas vraiment appris à lire, mais une intelligence artificielle a battu les humains à un test de lecture

Les robots nous battent aux échecs, au jeu de go. Ils composent même des albums. Aujourd’hui, une nouvelle étape vient d’être franchie par une intelligence artificielle. Pour la première fois, un programme a obtenu un meilleur score que les humains lors d’un test de compréhension de lecture. Une avancée qui laisse entrevoir de profondes mutations pour de nombreux métiers basés la restitution de données.

Alibaba passe le test de lecture de Stanford

L’entreprise qui a conçu ce programme n’est autre que la division Data Science d’Alibaba. Dans un communiqué, le groupe indique que « son modèle de deep learning a obtenu un score de 82,44 au Stanford Question Answering Data Set, le 11 janvier, battant ainsi le score des humains (82,304) ». Le SQuAD est une base de données permettant d’évaluer la compréhension de lecture, elle contient 100 000 questions-réponses basées sur les données issues de 500 articles Wikipédia.

Pour la première fois, un programme a mieux répondu aux questions posées que les humains. Les paragraphes, les phrases et les mots ont été analysés afin de repérer précisément les réponses potentielles, avant de déterminer la réponse la plus probable à une question donnée – et les réponses choisies étaient plus souvent exactes que celles formulées par les humains. En d’autres termes, les robots n’ont pas appris à lire, mais certains sont désormais capables de mieux restituer les informations disséminées (non-catégorisées) dans une base de données que les humains.

L’incidence du machine learning sur le monde du travail

Alilbaba précise que son modèle est déjà appliqué, notamment lors du Singles’ Day, depuis plusieurs années. Les clients d’Alibaba posent des questions et dans certains cas, c’est une machine qui leur répond. Les avancées de l’IA dans la restitution de données impactera fortement les opérateurs en charge du support client, qui seront moins sollicités. D’autres applications de ces modèles de machine learning sont envisagées, pour guider des touristes dans les musées voire même « pour répondre aux demandes liées à la santé ».

On peut néanmoins compter sur les médecins pour rapidement tirer la sonnette d’alarme à ce sujet. L’auto-diagnostic assisté par l’intelligence artificielle est sans doute plus risqué que les recherches personnelles sur Internet, car ces programmes donnent une réponse directe, qui fait autorité, et la base documentaire qui permet à ces programmes de répondre aux questions n’est pas toujours clairement identifiée et/ou fiable. Ces outils seront sans doute mieux utilisés par des professionnels expérimentés, pour faciliter leur travail… au moins dans un premier temps.

À noter qu’Alibaba travaille sur le machine learning appliqué à d’autres problématiques professionnelles (recherche personnalisée, détection d’erreurs grammaticales…) et que l’entreprise n’est déjà plus la seule à mieux restituer les éléments d’un texte que les humains. Dès le lendemain, les algorithmes conçus par Microsoft ont également réalisé cette prouesse. Pour aller plus loin, nous vous conseillons de consulter le dossier Futur du Travail de Mode(s) d’Emploi.

Sujets liés :
Publier un commentaire
Ajouter un commentaire

Votre adresse email ne sera pas publiée.

Les meilleurs outils pour les professionnels du web