hybrid ranking

Hybrid ranking er en søgeteknik, der kombinerer mindst to forskellige rangeringsmetoder, typisk en leksikalsk (f.eks. BM25) og en semantisk (f.eks. cosine similarity), for at forbedre relevansen af søgeresultater.

Kort fortalt

Hybrid ranking blander to måder at rangere resultater på – en der matcher nøjagtige ord, og en der forstår betydning – for at give de bedste svar.

Kategori
teknik
Niveau
øvet

Betydninger

1
  1. 1

    Kombination af to eller flere rangeringsalgoritmer for at opnå et samlet resultat, der udnytter styrkerne fra hver metode.

    • Systemet bruger hybrid ranking med BM25 og en transformer-baseret re-ranker for at forbedre præcisionen.
    • Hybrid ranking reducerer problemet med leksikalsk mismatch ved at inkludere semantisk lighed.

Hvornår bruges det

Hybrid ranking anvendes ofte i RAG-systemer (Retrieval-Augmented Generation) og søgemaskiner, hvor man først henter kandidater med en hurtig leksikalsk metode og derefter re-rangerer med en semantisk model. Det kan også implementeres som en vægtet sum af scores fra de to metoder.

Kodeeksempel

def hybrid_score(lexical_score, semantic_score, alpha=0.5):
    return alpha * lexical_score + (1 - alpha) * semantic_score

# Example: combine BM25 score and cosine similarity
final_score = hybrid_score(bm25_score, cosine_sim, alpha=0.3)

En simpel vægtet sum af leksikalsk og semantisk score.

Oprindelse

Udtrykket kommer af 'hybrid' (blanding) og 'ranking' (rangordning) og opstod i informationssøgning for at beskrive kombinationen af forskellige rangeringssignaler.

Afledte ord

2

Kilder

1