Le ranking de Perplexity expliqué : comment l’IA choisit ses sources
Une étude menée par le chercheur indépendant Metehan Yesilyurt décrypte les méthodes de Perplexity pour évaluer et classer le contenu, avant de l’utiliser dans ses réponses.

Perplexity s’impose comme l’un des moteurs de recherche assistée par IA les plus utilisés. Comprendre la logique de son classement de contenu devient alors essentiel pour les professionnels du digital. Une étude technique menée par Metehan Yesilyurt révèle la structure profonde de son algorithme, loin d’un simple système de recherche.
Pour rappel, Perplexity fonctionne comme un moteur conversationnel mais, en arrière-plan, c’est une véritable architecture de recherche hybride qui orchestre la sélection, le classement et la priorisation des contenus. Contrairement à l’idée reçue d’un moteur 100 % algorithmique, l’étude révèle une combinaison de critères automatiques, de scores sémantiques, de filtres manuels et d’interactions techniques avec les navigateurs. Voici ce qu’il faut en retenir.
Le système de reclassement L3 : l’autorité thématique avant tout
Selon les observations de Metehan Yesilyurt, Perplexity applique un système de reclassement avancé, basé sur un modèle d’apprentissage automatique à trois couches (L3), spécifiquement dédié aux « recherches d’entités ». Cela inclut les recherches sur des personnes, des entreprises, des concepts ou des sujets précis.
« Le L3 reranker représente un filtre de qualité critique. Le contenu ne doit pas seulement correspondre à une requête, il doit également passer cette évaluation supplémentaire pilotée par un modèle de machine learning », explique le chercheur indépendant.
Concrètement, ce système fonctionne en trois étapes :
- Perplexity récupère une première liste de résultats et applique un classement initial.
- Un modèle XGBoost applique une couche supplémentaire d’évaluation qualité.
- Si trop peu de documents atteignent le seuil défini, l’ensemble des résultats peut être écarté.
Cela signifie qu’un contenu peut être bien positionné selon des critères classiques, mais totalement ignoré si la qualité perçue ou l’autorité thématique est jugée insuffisante.
Perplexity assume une curation avec des domaines manuellement favorisés
Autre révélation majeure de l’étude : Perplexity maintient des listes manuelles de « domaines faisant autorité » dans plusieurs catégories (e-commerce, développement, éducation, communication…). En d’autres termes, certains sites bénéficient d’un traitement préférentiel intégré au système.
Selon Metehan Yesilyurt, « cette curation manuelle signifie que le contenu associé ou référencé par ces domaines bénéficie d’une autorité accrue ». Cela concerne des plateformes comme GitHub, LinkedIn, Reddit, Coursera, Booking, etc. Pour les créateurs et créatrices de contenu, l’enjeu est donc double. Soit produire depuis ces domaines, soit les intégrer intelligemment dans des contenus pour bénéficier de leur effet de levier.
Un effet YouTube qui booste la visibilité ?
L’étude met également en lumière une corrélation directe entre les titres de vidéos YouTube et les requêtes tendances de Perplexity. En clair, si un contenu vidéo reprend exactement l’intitulé d’une recherche populaire sur Perplexity, il obtient un avantage en visibilité.
Quand les vidéos YouTube utilisent des titres en correspondance exacte avec les requêtes tendances de Perplexity, elles reçoivent un avantage significatif sur les deux plateformes.
Cela suggère que Perplexity s’appuie sur YouTube comme un signal de validation de l’intérêt utilisateur. Les contenus multimédias qui répondent rapidement aux requêtes émergentes bénéficient donc d’une visibilité renforcée. Une opportunité évidente pour les marques et les créateurs réactifs.
Les signaux de ranking : ce qui renforce ou pénalise un contenu pour Perplexity
L’analyse de Metehan Yesilyurt identifie 59 facteurs influençant directement la visibilité des contenus. Voici les principaux enseignements :
- Performances des nouveaux contenus : Perplexity applique une logique de « période critique » après publication. Un nouveau contenu doit rapidement atteindre un taux d’impression et de clics élevé, sans quoi il perd sa fenêtre de visibilité. « Le new_post_ctr crée un scénario décisif : les publications doivent atteindre des niveaux d’engagement spécifiques pendant cette fenêtre pour être amplifiées algorithmiquement. »
- Catégorisation thématique : les contenus sont fortement favorisés ou pénalisés en fonction de leur sujet. Les thématiques IA, technologie, science, business reçoivent un multiplicateur positif, tandis que les contenus liés au divertissement ou au sport sont fortement déclassés.
- Dégradation temporelle : un facteur appelé time_decay_rate induit une perte de visibilité progressive et rapide après publication. Il faut soit publier fréquemment, soit actualiser régulièrement le contenu pour rester visible.
- Pertinence sémantique : le moteur ne se contente pas de mots clés. Il compare la similarité sémantique entre la requête et le contenu via des embeddings. « Le seuil d’embedding_similarity agit comme un garde-fou de qualité : un contenu trop éloigné du sens attendu ne sera tout simplement pas proposé. »
- Engagement utilisateur : le système surveille les clics, les taux de retour, les lectures prolongées, les comportements sur 7 jours et plus. Plus un contenu engage durablement, plus il est valorisé.
- Réseaux de contenu : Perplexity valorise les contenus interconnectés. Si un article fait partie d’un réseau logique de pages (même thématique, liens croisés, structure cohérente), sa performance est amplifiée via le système boost_page_with_memory.
- Signaux négatifs : le moteur pénalise les contenus faiblement cliqués, dislikés ou vus sans interaction. Il existe des seuils explicites (dislike_filter_limit, discover_no_click_7d) au-delà desquels un contenu est masqué.
- Diversité des sources et des hashtags : Perplexity pénalise les contenus trop homogènes dont les hashtags qui sont trop similaires, qui abusent de liens vers un même domaine ou qui proposent une faible variété des formats. Les systèmes blender_web_link_domain_limit ou diversity_hashtag_similarity_threshold visent à maintenir la diversité des résultats.
Une logique de qualité connectée
L’étude de Metehan Yesilyurt révèle que Perplexity ne récompense pas uniquement la pertinence immédiate d’un contenu. Il faut penser qualité perçue, engagement dès les premières minutes, réseautage de contenu et présence sur les bonnes plateformes (comme YouTube et certains domaines autoritaires). Le chercheur résume la philosophie du moteur ainsi :
Le succès dans Perplexity exige une sélection stratégique des sujets, une amplification rapide à la publication, des contenus interconnectés et une optimisation continue, avec une priorité donnée à la qualité plutôt qu’aux mécaniques de manipulation algorithmique.
Pour les pros du digital, il s’agit donc moins de « faire du SEO Perplexity » que de comprendre l’écosystème de signaux dans lequel ce moteur opère. Les bases sont là. À chacun de les activer intelligemment.