hybrid søgningsmodel

En søgestrategi der kombinerer traditionel søgning baseret på nøgleord (f.eks. BM25) med semantisk søgning baseret på vektorembeddings for at forbedre relevansen af søgeresultater.

Kort fortalt

Hybrid søgning blander den præcise matchning af nøgleord med forståelsen af betydning fra semantisk søgning, så man får de bedste resultater fra begge verdener.

Kategori
teknik
Niveau
øvet

Betydninger

1
  1. 1

    En søgemetode der fusionerer resultaterne fra en nøgleordsbaseret søgemaskine (f.eks. BM25) og en semantisk vektorsøgning, typisk ved at beregne en vægtet sum af relevansscorer eller ved at ranglisterne flettes.

    • Ved at implementere en hybrid søgningsmodel kunne systemet både finde dokumenter med præcise nøgleord og dokumenter der semantisk matchede forespørgslen.
    • Mange moderne RAG-systemer anvender en hybrid tilgang for at opnå bedre genfinding af relevante kontekster.

Hvornår bruges det

Hybrid søgning bruges typisk i RAG-systemer og informationsgenfindingssystemer, hvor man ønsker både at matche specifikke termer og fange kontekstuel lighed. Implementeringen indebærer ofte en vægtet kombination af relevansscorer fra de to metoder.

Kodeeksempel

def hybrid_score(bm25_score, vector_score, alpha=0.5):
    return alpha * bm25_score + (1 - alpha) * vector_score

Eksempel på en simpel vægtet kombination af BM25-score og vektorlignedsscore.

Oprindelse

Udtrykket hybrid anvendes her om en kombination af to forskellige søgeteknikker, hvilket er analogt med brugen i andre tekniske felter.

Afledte ord

2

Kilder

2