IA : le contenu de Reddit sera utilisé pour entraîner les modèles de Google

En échange d’une compensation annuelle de 60 millions de dollars, Google pourra utiliser le contenu publié sur Reddit pour entraîner ses modèles de langage.

En monétisant son contenu, Reddit prépare son introduction en Bourse. © Julien Eichinger - stock.adobe.com

Reddit et Google signent un partenariat historique

Selon plusieurs médias, Reddit s’apprête à monétiser le contenu généré par ses utilisateurs. Le plus grand forum de discussion du monde aurait, en effet, noué un partenariat annuel de 60 millions de dollars avec Google. Cet arrangement donnerait à l’entreprise, basée à Mountain View, le droit d’utiliser le contenu publié sur la plateforme pour entraîner ses modèles d’IA générative, dont Gemini, dévoilé au mois de décembre, qui alimente l’interface conversationnelle du même nom, anciennement baptisée Google Bard.

L’information a d’abord été révélée par Bloomberg, qui rapportait dès le 16 février qu’un partenariat de 60 millions de dollars avait été noué avec « une entreprise spécialisée dans l’intelligence artificielle », sans que celle-ci soit précisée. Ce jeudi 22 février, la nouvelle a été confirmée à l’agence de presse Reuters par plusieurs sources proches du dossier. Cet accord, dont les contours sont encore flous, aurait été conclu sans préalablement consulter les utilisateurs, pourtant habitués à exprimer leur mécontentement à chaque révision du fonctionnement de la plateforme.

Avec la monétisation de son contenu, Reddit prépare son introduction en Bourse

Avec plus de 73 millions d’utilisateurs actifs quotidiennement, la « page d’accueil d’Internet » constitue une source précieuse d’informations pour un modèle de langage. Majoritairement peuplé d’anglophones, Reddit se divise en plusieurs milliers de sous-forums (ou subreddits) couvrant un large éventail de thématiques, de ChatGPT aux jeux vidéo en passant par l’actualité politique. La monétisation du contenu produit par les utilisateurs, matérialisée par ce partenariat, aurait pour finalité de préparer l’introduction en Bourse de l’entreprise, prévue pour mars selon Reuters. À cette occasion, Reddit aspirerait à obtenir une valorisation à hauteur de 5 milliards de dollars.

Comme le rapporte le quotidien Le Temps, qui a consulté les documents soumis à la SEC, l’organisme régulant les marchés financiers, Reddit a clairement l’intention d’exploiter l’immense quantité de données à sa disposition pour croître, en complément de ses revenus publicitaires (environ 800 millions de dollars en 2023). « Nous espérons que notre avantage en matière de données et notre propriété intellectuelle continueront d’être un élément clé de l’entraînement des futurs modèles de langage », aurait notamment écrit Steve Huffman, co-fondateur et PDG du réseau social, dans une lettre adressée à l’organisme fédéral.

Google dispose d’un « accès privilégié à l’API » de Reddit

Mais quelle forme concrète prendra cet accord avec Google ? L’ensemble du contenu mis en ligne sur la plateforme pourra-t-il être exploité pour l’entraînement des modèles ? Sera-t-il possible, en tant qu’utilisateur, de refuser que nos publications soient utilisées ? Difficile de le savoir, à ce stade. Dans un blog post publié ce jeudi 22 février, Google révèle avoir « étendu son partenariat avec Reddit », sans spécifier clairement les modalités dudit partenariat. L’entreprise, basée à Mountain View, précise néanmoins avoir désormais accès à l’API de Reddit, lui permettant d’obtenir un « accès privilégié et structuré à des informations plus fraîches, ainsi qu’à des signaux qui [l’aideront] à mieux comprendre, afficher et utiliser le contenu disponible sur Reddit », y compris via ses produits ou services.

Sujets liés :
Publier un commentaire
Ajouter un commentaire

Votre adresse email ne sera pas publiée.

Visuel enquête Visuel enquête

Community managers : découvrez les résultats de notre enquête 2025

Réseaux, missions, salaire... Un webinar pour tout savoir sur les CM, lundi 29 septembre à 11h !

Je m'inscris

Les meilleurs outils pour les professionnels du web