Étude : 90 % des sources citées par les IA ne figurent pas dans les top 10 Google et Bing

Une étude Ahrefs révèle que les citations des IA ne recoupent que 11 % des top 10 Google et Bing. Perplexity sort du lot, ChatGPT et Gemini restent en retrait.

IA-moteurs-de-recherche-ahrefs
Pour la plupart des IA, le taux d'alignement avec le top 10 des résultats de recherche traditionnels ne dépasse pas 9 %. © Ahrefs

L’arrivée de l’IA dans le Search chamboule un certain nombre de certitudes. Ahrefs, spécialiste de l’analyse SEO, s’est attaché, dans une récente étude, à montrer à quel point les différences étaient grandes entre les liens proposés par les moteurs de recherche traditionnels et les IA.

Un faible chevauchement entre citations IA et résultats de recherche

Ahrefs a passé au crible le comportement de quatre IA populaires (ChatGPT, Gemini, Copilot et Perplexity) pour mesurer leur alignement avec les résultats des moteurs de recherche. L’analyse, menée par la data scientist Xibeijia Guan, porte sur un corpus de 15 000 requêtes longues, qui couvrent des questions pratiques, nutritionnelles, assurantielles ou encore multilingues.

Chaque requête a été testée dans Google et Bing, puis soumise aux assistants IA. Les citations visibles (liens dans le texte ou en références) ont été extraites et comparées aux classements dans les moteurs, pour vérifier si elles apparaissaient dans le top 10 ou le top 100 des résultats.

Le constat est net. En moyenne, seuls 11 % des liens cités par les assistants figurent dans le top 10 Google/Bing pour la même requête (précisément 10,96 %). Le taux monte légèrement pour Google seul (11,9 %, soit environ 12 %) et descend à 10 % pour Bing. À l’inverse, environ 80 % des citations analysées ne se classent pas du tout dans les résultats Google pour la requête initiale (voir image de une).

Perplexity, champion de l’alignement avec Google

Dans ce panorama, Perplexity fait figure d’exception. L’outil, présenté comme le « premier moteur de réponses », a été pensé dès l’origine pour citer systématiquement ses sources. Sa méthodologie semble payante : 28,6 % des pages qu’il cite se trouvent dans le top 10 Google. Les autres IA tournent autour de 8 %, qu’il s’agisse de ChatGPT, Gemini ou Copilot (voir image de une et ci-dessous).

Copilot se démarque surtout sur Bing, avec un taux de chevauchement de 16,6 % dans le top 10, ce qui semble logique pour un produit Microsoft qui s’appuie directement sur l’index Bing. ChatGPT et Gemini restent en retrait, notamment parce qu’ils ne déclenchent pas systématiquement de recherche externe. Dans le cas de ChatGPT, l’activation d’une requête web dépend d’un mécanisme interne appelé « sonic classifier ». Ainsi, si le modèle estime que la réponse est peu prédictible à partir de ses données d’entraînement, il lance alors une recherche.

IA-Bing-moteurs-de-recherche-ahrefs
C’est logiquement Copilot qui bénéficie du meilleur alignement avec Bing. © Ahrefs

Autre particularité : Perplexity ne puise pas dans les index Google ou Bing, mais dans le sien, alimenté par son propre robot d’indexation, perplexitybot. Sa forte corrélation avec les résultats Google montre qu’il privilégie naturellement des contenus déjà bien positionnés, sans dépendre directement des SERP des grands moteurs.

IA-Google-moteurs-de-recherche-ahrefs
Perplexity est bien plus aligné avec le top 10 de Google que les autres IA. © Ahrefs

Pourquoi l’écart reste-t-il si marqué entre IA et moteurs de recherche ?

La faible correspondance entre les citations d’IA et les résultats de recherche traditionnels tient surtout à la différence de logique dans la sélection des sources. Les moteurs comme Google ou Bing répondent à une requête exacte. Les assistants IA, eux, utilisent souvent une technique dite de « query fan-out ». Au lieu de traiter uniquement la demande de l’utilisatrice ou de l’utilisateur, ils génèrent un ensemble de variantes proches (« comment détartrer une machine à café », « nettoyage machine Nespresso », « enlever calcaire cafetière », par exemple) et combinent les résultats obtenus.

Cette fusion peut se faire avec des méthodes comme le Reciprocal Rank Fusion (RRF), qui favorise les pages apparaissant régulièrement dans plusieurs listes, même si elles ne sont pas dans le top pour la requête initiale. Ainsi, une page peut être citée, même si elle n’est pas visible dans le top 100 pour la formulation exacte donnée par l’utilisateur.

S’ajoute à cela une dimension de personnalisation. L’historique de conversation, le contexte du prompt ou la langue peuvent influer sur les sources retenues. Deux utilisateurs posant la même question peuvent donc obtenir des citations totalement différentes. Enfin, certaines IA n’ont pas vocation à coller aux SERP. ChatGPT et Gemini, par exemple, adaptent leurs citations en fonction de critères internes et ne linkent pas systématiquement vers des sources externes, ce qui accentue l’écart avec les résultats des moteurs.

Des implications pour le SEO et la stratégie de contenu

Pour les éditeurs et responsables SEO, cette étude souligne qu’être bien positionné sur Google ou Bing n’assure pas de figurer dans les citations des IA. Optimiser uniquement pour la requête exacte risque de laisser de côté une grande partie des opportunités.

Les données de Ahrefs suggèrent plutôt de travailler sur des clusters de sujets et des variations de requêtes longues, afin de maximiser la probabilité d’apparaître dans plusieurs formulations liées. Comprendre cette logique de « recherche élargie » devient donc un enjeu stratégique. Si les moteurs d’IA et les SERP classiques restent encore très différents dans leurs choix de sources, la convergence pourrait s’accentuer (ou non) avec l’évolution des modèles et le développement des outils de Google, comme les AI Overviews et l’AI Mode.

AI-overviews-ahrefs
En comparaison, plus des trois quarts des résumés IA de Google correspondent au top 10 des résultats traditionnels. © Ahrefs
Sujets liés :
Publier un commentaire
Ajouter un commentaire

Votre adresse email ne sera pas publiée.

Les meilleurs outils pour les professionnels du web