Cloudflare accuse Perplexity de crawler illégalement des sites web
L’entreprise de cybersécurité Cloudflare dénonce Perplexity et ses méthodes pour récupérer des contenus sans autorisation. La startup IA se défend.

Perplexity contourne les blocages mis en place par les sites web afin d’accéder à leurs contenus. C’est en tout cas ce qu’affirme Cloudflare. Dans un blog post publié ce lundi 4 août 2025, l’entreprise américaine spécialisée dans la sécurité en ligne a accusé publiquement Perplexity d’explorer des sites web et d’y récupérer des données sans autorisation.
Perplexity contourne les règles de pare-feu mises en place par certains sites
Chaque site Internet est libre de fixer ses limites aux robots qui collectent des données. Cela peut prendre la forme d’instructions via un fichier nommé robots.txt ou par des règles de pare-feu (WAF). Sauf que le moteur de recherche par IA Perplexity ne semble pas vraiment décidé à respecter ces quelques règles.
Selon le rapport de Cloudflare, le moteur de recherche par IA observe un comportement de « stealth crawling », c’est-à-dire une exploration non autorisée sur des sites pour y collecter des données. Données qu’il utilise ensuite pour répondre aux questions de ses utilisateurs. Lorsque l’outil se retrouve face à un blocage réseau, il masquerait son identité en modifiant son agent utilisateur et ses ASN sources. Il ignore même parfois les fichiers robots.txt pour mener à bien son exploration.
Après avoir reçu plusieurs plaintes de clients qui signalaient que Perplexity accédait à leurs sites malgré l’interdiction de ses robots, Cloudflare a mené une série de tests. L’entreprise a créé des sites inconnus aux robots de Perplexity et y a bloqué tout crawl. Pourtant, malgré l’absence d’indexation par d’autres moteurs de recherche, Perplexity a réussi à fournir des informations issues de ces pages censées lui être inaccessibles. Ce n’est pas la première fois que Cloudflare se joue des IA : un labyrinthe infini avait notamment été créé pour les piéger.
Selon Perplexity, son IA n’agit pas comme un robot
Contre les affirmations de Cloudflare, Perplexity a cherché à se défendre avec des arguments plutôt bancals. L’entreprise prétend que ses robots… ne sont pas des robots. Selon elle, ses « assistants IA » ne sont pas des robots d’exploration web mais des agents déclenchés par l’utilisateur. Toujours d’après Perplexity, « ce système ne stocke pas ces informations et ne s’en sert pas pour s’entraîner ».
Par exemple, si un utilisateur souhaite connaître les derniers avis d’un restaurant, l’IA récupère et résume le contenu qu’elle juge pertinent pour le transmettre et répondre à la demande. Un fonctionnement qui, toujours selon l’entreprise d’IA, est bien différent de celui des crawlers traditionnels qui « indexent de vastes portions du web sans tenir compte de l’intention immédiate de l’utilisateur ».
Cet épisode ne fait qu’alimenter les critiques récurrentes visant les entreprises d’intelligence artificielle, souvent accusées de collecter massivement des données sur le web sans consentement pour nourrir et améliorer leurs modèles. Une polémique de plus qui risque de ternir encore un peu plus leur réputation.
Community managers : découvrez les résultats de notre enquête 2025
Réseaux, missions, salaire... Un webinar pour tout savoir sur les CM, lundi 29 septembre à 11h !
Je m'inscris