hybrid ranking
Hybrid ranking er en søgeteknik, der kombinerer mindst to forskellige rangeringsmetoder, typisk en leksikalsk (f.eks. BM25) og en semantisk (f.eks. cosine similarity), for at forbedre relevansen af søgeresultater.
Kort fortalt
Hybrid ranking blander to måder at rangere resultater på – en der matcher nøjagtige ord, og en der forstår betydning – for at give de bedste svar.
- Kategori
- teknik
- Niveau
- øvet
Betydninger
1- 1
Kombination af to eller flere rangeringsalgoritmer for at opnå et samlet resultat, der udnytter styrkerne fra hver metode.
- Systemet bruger hybrid ranking med BM25 og en transformer-baseret re-ranker for at forbedre præcisionen.
- Hybrid ranking reducerer problemet med leksikalsk mismatch ved at inkludere semantisk lighed.
Hvornår bruges det
Hybrid ranking anvendes ofte i RAG-systemer (Retrieval-Augmented Generation) og søgemaskiner, hvor man først henter kandidater med en hurtig leksikalsk metode og derefter re-rangerer med en semantisk model. Det kan også implementeres som en vægtet sum af scores fra de to metoder.
Kodeeksempel
def hybrid_score(lexical_score, semantic_score, alpha=0.5):
return alpha * lexical_score + (1 - alpha) * semantic_score
# Example: combine BM25 score and cosine similarity
final_score = hybrid_score(bm25_score, cosine_sim, alpha=0.3)En simpel vægtet sum af leksikalsk og semantisk score.
Oprindelse
Udtrykket kommer af 'hybrid' (blanding) og 'ranking' (rangordning) og opstod i informationssøgning for at beskrive kombinationen af forskellige rangeringssignaler.