RRF, Reciprocal ranking fusion tech qui classe les réponses sur les LLMs (Chatgpt, Gemini)

décembre 4, 2025

TLDR

RRF : Reciprocal Ranking Fusion, c’est quoi ?

Le Reciprocal Ranking Fusion (RRF) est une méthode algorithmique utilisée par ChatGPT et d’autres modèles de langage pour fusionner plusieurs listes de résultats classés en un seul classement final.

Objectif du reciprocal ranking fusion

L’objectif du Reciprocal Ranking Fusion est d’offrir à l’utilisateur les sources les plus pertinentes, c’est-à-dire celles qui répondent le mieux à sa requête.

Reciprocal Rakning Fusion, comment ca marche ?

Le reciprocal ranking fusion(RRF) calcule un score pour chaque document en faisant la somme des inverses de sa position (rank) dans chaque liste, ajustée par une constante.

RRF fonctionne, en vrai, selon un principe simple : les documents qui apparaissent en tête des résultats dans plusieurs méthodes de recherche sont susceptibles d’être véritablement pertinents.

Les étapes du Reciprocal Ranking Fusion

Les avantages du Reciprocal Ranking Fusion

La RRF, c’est un peu le couteau suisse de la fusion de résultats.

Simple comme bonjour : pas besoin de données d’entraînement, pas de normalisation compliquée. Tu l’implémente en 5 minutes, ça calcule vite, et basta.
Solide : peu importe tes échelles de notation, ça fonctionne. Des résultats incomplets ? Pas de problème, la RRF encaisse.
Performant : contre toute attente, cette méthode basique bat régulièrement des techniques beaucoup plus sophistiquées. Surtout quand tu combines des approches différentes.

Les études le confirment : pour mixer recherche par mots-clés et recherche sémantique, la RRF fait le taf. Point.

Exemple du RRF

Intéressons nous a une requête : « comment choisir chaussures trail » sur Google

La SERP est multimodale : articles de blog, vidéos YouTube, snippets featured, images. Google mixe tout ça.

Chatgpt, veux comprendre quel contenu performe vraiment en combinant plusieurs signaux de ranking. Il ne fait donc pas qu’une seule recherche Google. Il combine :

Recherche par mots-clés (Bing API ou équivalent)
Recherche sémantique (vector search sur des embeddings)
Recherche sur des sources fiables (base de données vérifiées : Wikipédia, sites académiques, etc.)

Chaque système retourne son propre classement de résultats. La RRF fusionne tout ça pour décider quelles sources citer dans la réponse finale.

Le calcule du score RRF des sources se fait (théoriquement) comme suit :

Calcul RRF détaillé (k=60)

Source	Mots-clés	Sémantique	Fiabilité	Total RRF
Tom’s Hardware	1/(60+1) = 0,0164	1/(60+2) = 0,0161	1/(60+3) = 0,0159	0,0484
LesNumeriques	1/(60+3) = 0,0159	1/(60+6) = 0,0152	1/(60+4) = 0,0156	0,0467
TechPowerUp	0	1/(60+1) = 0,0164	1/(60+2) = 0,0161	0,0325
AnandTech	0	1/(60+3) = 0,0159	1/(60+1) = 0,0164	0,0323
PCGamer	1/(60+2) = 0,0161	1/(60+4) = 0,0156	0	0,0317
Reddit	1/(60+4) = 0,0156	0	0	0,0156
Hardware Unboxed	0	1/(60+5) = 0,0154	0	0,0154
Amazon	1/(60+5) = 0,0154	0	0	0,0154

Resultat ?

ChatGPT va prioriser les 3-4 premières sources pour construire sa réponse

Quel est l’impact du RRF ?

Sans RRF, en se basant uniquement sur une recherche des mots-clés :

ChatGPT citerait Tom’s Hardware #1, PCGamer #2, puis… Reddit et Amazon. Pas terrible en fiabilité.

Sans RRF, en se basant uniquement sur une recherche sémantique) : ChatGPT citerait TechPowerUp #1, Tom’s #2, AnandTech #3. Manque de diversité, trop technique.

Avec RRF :

ChatGPT mixe pertinence SEO + sémantique + fiabilité. Tom’s Hardware remonte car il est bon partout. LesNumeriques suit de près. Reddit et Amazon disparaissent du top (pas assez fiables).

Quelle relation entre les Query Fan Out et le reciprocal ranking fusion ?

Le Query Fan-Out et le reciprocal ranking fusion RRF sont deux faces d’une même médaille dans ChatGPT et les autres LLMs.

Query Fan Out = la décomposition de la requête
RRF = la recomposition des résultats

C’est un pipeline en deux temps :

Requête utilisateur
↓
Query Fan-Out (1 → N requêtes)
↓
N recherches parallèles = N classements différents
↓
RRF (fusion des N classements)
↓
Classement unique final

Query Fan Out – Reciprocal Ranking Fusion (RRF) = chaos

L’utilisation des query fan out sans le reciprocal ranking fusion serait le chaos pour Chatgpt et les autres LLMs( y compris Google).

Je m’explique : Chatgpt décompose une requête en N sous-requêtes. Il obtient donc N listes de résultats différentes. Mais comment il choisit quelles sources utiliser ?

Prendre le #1 de chaque liste ? On risques d’avoir 5 sources redondantes.
Prendre seulement la première liste ? On perds la richesse des autres angles.
Faire une moyenne manuelle ? Impossible à grande échelle.

Sans RRF, le query fan-out n’a aucune méthode de fusion robuste

Comment Chatgpt calcul le score Reciprocal Ranking Fusion ?

On a dit que la RRF repose sur une base mathématique. Quelle est la formule exacte que ChatGPT utilise ?

Spoiler : on ne l’a pas. Ce serait trop facile.

OpenAI ne publie pas les détails de son implémentation. C’est leur sauce secrète. Mais certains ont creusé.

Methan AI a fouillé dans le backend de ChatGPT pour tenter de récupérer la formule. En inspectant l’implémentation de la recherche de ChatGPT, Il a trouvé ce code révélateur :

rrf_alpha : 1,

rrf_input_threshold : 0,

ranking_model : null

Cela petit bout de code confirme que ChatGPT utilise le RRF standard pour combiner les résultats de recherche. Ce qui est intéressant, c’est que cette implémentation révèle l’importance du classement pour les multiples variations de requêtes.

Methan AI pousse le cap un peu plus en mettant en avant les facteurs et critères qui sont susceptibles d’influencer les scores RRF des contenus.

Voici une version en liste, claire, directe, efficace — toujours avec une touche Leo Duff :

Optimiser son contenu pour le Reciprocal Ranking Fusion (RRF)

Construire une vraie topical authority : produisez du contenu qui couvre un sujet en profondeur. Plus votre site maîtrise un thème, plus le RRF vous favorise.
Créer des cocons sémantiques : regroupez vos contenus par intention, pas seulement par mots-clés. Vous devez répondre à toute la constellation de questions autour d’un sujet.
Couvrir toutes les sous-requêtes : le RRF fonctionne avec un query fan-out très large. Votre contenu doit anticiper : angles secondaires, variantes, questions connexes… tout ce qui peut être déclenché autour de la requête principale.
Enrichir le lexique et la sémantique : utilisez un vocabulaire riche et précis. Plus votre texte apporte de contexte, mieux il est compris et classé.
Adopter une stratégie multimodale : la SERP devient multi-format : texte, image, vidéo, audio. Intégrez plusieurs médias pour renforcer votre visibilité et répondre aux différents modes de recherche.
Favoriser la clarté et la structure : le RRF exploite les signaux utilisés par différents modèles : titres propres, hiérarchie logique, sections nettes. Faites simple, lisible, immédiatement compréhensible.

Comment calculer le score RRF de son contenu ?

Si vous détestez le code, les scripts et tout ce qui ressemble de près ou de loin à une ligne Python… vous êtes un peu mal barré.

Il n’existe tout simplement aucun outil no-code pour estimer les scores RRF. Nada. Le désert.

Cela dit, pas besoin de sortir le violon : il existe quand même des moyens simples mais simplistes pour faire des approximations. Pas parfait, pas académique, mais suffisant pour comprendre les tendances et ne pas rester dans le flou total.

Calculer son score Reciprocal Ranking Fusion avec un script SQL

Si vous êtes un geek SQL comme moi, vous pouvez jouez avec ce script que j’ai croisé sur la toile sur le meme sujet:

WITH fulltext AS (
  SELECT id, RANK() OVER (ORDER BY score DESC) AS rank
  FROM (
    SELECT id, pdb.score(id) AS score
    FROM mock_items
    WHERE description @@@ 'keyboard'
    ORDER BY pdb.score(id) DESC
    LIMIT 20
  )
),
--- Semantic search, using pgvector and cosine distance for ranking
semantic AS (
  SELECT
    id,
    RANK() OVER (ORDER BY embedding <=> '[1,2,3]') AS rank
  FROM mock_items
  ORDER BY embedding <=> '[1,2,3]'
  LIMIT 20
),

-- Calculate RRF contributions from each ranker
rrf AS (
  SELECT id, 1.0 / (60 + rank) AS s FROM fulltext
  UNION ALL
  SELECT id, 1.0 / (60 + rank) AS s FROM semantic
)

-- Sum the RRF scores, order by them, and join back the original data
SELECT
  m.id,
  sum(s),
  m.description
FROM rrf
JOIN mock_items AS m USING (id)
GROUP BY m.id, m.description
ORDER BY sum(s) DESC
LIMIT 5;

Plateformes avec RRF intégré :

Plusieurs services proposent RRF nativement sans nécessiter de codage . Azure AI Search intègre RRF pour la recherche hybride, tout comme OpenSearch, Elasticsearch et MariaDB . Ces plateformes calculent automatiquement les scores lors des requêtes hybrides.

Google Sheets / Excel :

Vous êtes SEO, vous êtes donc plutôt Excel et Sheets. Pas de souci, vous pouvez créer un tableau de calcul simple avec la formule RRF : =1/(60+rang) où 60 est la constante k standard . Pour chaque document, additionnez les scores provenant de différentes listes de classement.

Triez ensuite par score décroissant pour obtenir le classement fusionné.

Conclusion

Le Reciprocal Rank Fusion, combiné au Query Fan-Out des modèles type GPT, change radicalement la façon dont un contenu est compris, évalué et assemblé dans les moteurs de recherche modernes. On n’optimise plus pour une requête isolée : on optimise pour un écosystème de micro-requêtes générées en cascade.

En travaillant une vraie topical authority, en structurant des cocons sémantiques solides, en enrichissant votre densité lexicale et en adoptant une présence multimodale, vous rendez votre contenu non seulement lisible, mais interprétable par ces systèmes hybrides.

Le couple RRF + Fan-Out ne récompense pas les textes superficiels : il met en avant les contenus profonds, cohérents, riches en signaux.

Si vous comprenez cette logique, vous créez un avantage durable dans la SERP comme dans les environnements IA.

Si tu veux que ChatGPT cite ton contenu,

Optimise pour les mots-clés (recherche classique)
Optimise pour l’intent sémantique (structure claire, réponses directes)
Booste ta fiabilité (backlinks de sites autoritaires, expertise reconnue)
Travailler l’autorité (topical authority) de votre site

Un seul de ces 3 axes ne suffit pas. La RRF privilégie les sources qui performent sur plusieurs tableaux.

Voilà, c’est ça l’impact du reciprocal ranking fusion dans le contexte ChatGPT/SearchGPT et GEO. Un système qui fusionne plusieurs moteurs de recherche pour donner les meilleures sources possibles. Simple, robuste, efficace.

SEO / GEO consultant

Aslane SAMAI

Google AIO SEO