Pourquoi OpenAI signe un partenariat avec Reddit ?

En bénéficiant d’un accès à l’API de Reddit, OpenAI pourra perfectionner ses modèles et alimenter ChatGPT en « contenu unique et structuré ».

Le montant de l'accord entre Reddit et OpenAI n'a pas été publiquement dévoilé. © PixieMe - stock.adobe.com

La « page d’accueil d’Internet » devient une nouvelle source inépuisable de contenus pour les modèles d’OpenAI. Ce jeudi 16 mai 2024, Reddit a annoncé, dans un communiqué, la signature d’un partenariat avec OpenAI, qui permettra à la société créatrice de ChatGPT, DALL-E et Sora « d’intégrer le contenu de Reddit à ChatGPT ainsi qu’à de nouveaux produits ».

Pour afficher ce contenu issu des réseaux sociaux, vous devez accepter les cookies et traceurs publicitaires.

Ces cookies et traceurs permettent à nos partenaires de vous proposer des publicités et des contenus personnalisés en fonction de votre navigation, de votre profil et de vos centres d’intérêt.Plus d’infos.

Accepter

Entre Reddit et OpenAI, un échange de bons procédés

Si le montant de l’accord n’a pas été divulgué, Reddit en a détaillé les principaux contours. En substance, OpenAI aura accès à l’API de la plateforme, et par ricochet à son « contenu unique, structuré et en temps réel », ce qui permettra à ses outils « de mieux comprendre et présenter le contenu de Reddit, notamment sur des thématiques récentes ».

En contrepartie, l’immense forum, qui compte 73 millions d’utilisateurs actifs chaque jour, pourra s’appuyer sur les technologies de son partenaire pour concevoir des fonctionnalités alimentées par IA, afin d’améliorer l’expérience des utilisateurs et des modérateurs de la plateforme. OpenAI devient également un partenaire publicitaire de Reddit. Ce qui peut susciter quelques interrogations, dans la mesure où Sam Altman, PDG d’OpenAI, détient 8,7 % des parts de la plateforme, rappelle TechCrunch.

Maintenir l’ouverture d’Internet est crucial, et cela signifie notamment que le contenu de Reddit doit être accessible à ceux qui favorisent l’apprentissage humain et recherchent des moyens de construire une communauté, un sentiment d’appartenance et d’autonomisation en ligne, déclare Reddit dans son communiqué.

Un accord similaire déjà conclu avec Google

Récemment introduit en bourse, Reddit cherche, depuis plusieurs mois, à monétiser le contenu généré par ses utilisateurs. L’objectif : profiter de son avantage stratégique sur les plateformes concurrentes pour diversifier ses sources de revenus, qui proviennent essentiellement de la publicité (800 millions de dollars en 2023), et ainsi atteindre la rentabilité. En février dernier, la plateforme a déjà accordé à Google un « accès privilégié » à son API afin de perfectionner ses modèles de langage, tels que Gemini, moyennant une compensation annuelle de 60 millions de dollars. Selon la BBC, les actions de Reddit ont grimpé d’environ 11 % à la suite de l’annonce du partenariat conclu avec OpenAI.

Reddit, une mine d’or pour un grand modèle de langage

Parfois accusé, notamment par le New York Times, de piller les contenus disponibles sur le web pour alimenter ses modèles, OpenAI a trouvé, en Reddit, l’allié idéal pour perfectionner ses technologies. Prisé des utilisateurs anglophones, et plus confidentiel en France, Reddit se divise en plusieurs milliers de sous-forums couvrant un large éventail de sujets, allant de l’histoire à la technologie en passant par le DIY. Ses subreddits les plus populaires, comme r/TodayILearned (36 millions de membres) ou r/interestingasfuck (12 millions de membres) peuvent être suivis et alimentés quotidiennement par plusieurs millions d’utilisateurs. N’étant pas régis par un algorithme mais par un système de vote d’approbation – qui valorise les contenus les plus pertinents, amusants, ou créatifs -, ces espaces de discussions sont continuellement enrichis par un mélange d’avis, de mèmes ou d’expériences personnelles.

En d’autres termes, il s’agit d’une véritable mine d’or pour un grand modèle de langage (LLM), et par extension pour ChatGPT, le produit phare d’OpenAI, qui peine à générer du contenu qui ne soit pas désincarné et robotique. « Reddit est devenu l’une des plus grandes archives ouvertes de l’internet, regorgeant de conversations authentiques, pertinentes et constamment mises à jour sur tout et n’importe quoi », appuie Steve Huffman, le PDG de la plateforme. Selon Statista, près de 470 millions de publications ont, en 2023, été partagées sur cette plateforme, qui héberge une archive de plus d’un milliards de topics et 16 milliards de commentaires.

Nous sommes ravis de nous associer à Reddit pour enrichir ChatGPT avec des informations uniques, précises et pertinentes, s’est réjoui Brad Lightcap, COO d’OpenAI.

Sujets liés :
Publier un commentaire
Ajouter un commentaire

Votre adresse email ne sera pas publiée.

Visuel enquête Visuel enquête

Community managers : découvrez les résultats de notre enquête 2025

Réseaux, missions, salaire... Un webinar pour tout savoir sur les CM, lundi 29 septembre à 11h !

Je m'inscris

Les meilleurs outils pour les professionnels du web