hybrid søgningsmetode

En søgningsmetode der kombinerer traditionel nøgleordsbaseret søgning (fx BM25) med semantisk søgning baseret på vektorembeddings for at forbedre relevansen.

Kort fortalt

Hybrid søgning bruger både nøgleord og betydning til at finde de bedste resultater, så man får det bedste fra begge verdener.

Kategori
teknik
Niveau
øvet

Betydninger

1
  1. 1

    Kombination af nøgleordsbaseret og semantisk søgning for at forbedre genfindingskvaliteten i informationssystemer.

    • Hybrid søgningsmetode forbedrer recall ved at fange dokumenter, der matcher både nøgleord og begreber.faglitteratur, 2024
    • Systemet anvender en hybrid søgningsmetode, der vægter BM25 og vektorsøgning ligeligt.dokumentation, 2023

Hvornår bruges det

Hybrid søgning anvendes i RAG-systemer og informationsgenfinding, hvor man ønsker at kombinere præcisionen fra nøgleordssøgning med forståelsen fra semantisk søgning. Det implementeres typisk ved at fusionere scores fra to eller flere retrieval-modeller.

Kodeeksempel

def hybrid_search(query, bm25_index, embedding_model, documents, alpha=0.5):
    bm25_scores = bm25_index.get_scores(query)
    query_emb = embedding_model.encode(query)
    doc_embs = embedding_model.encode(documents)
    cos_scores = cosine_similarity(query_emb, doc_embs)[0]
    hybrid_scores = alpha * bm25_scores + (1 - alpha) * cos_scores
    return sorted(zip(documents, hybrid_scores), key=lambda x: x[1], reverse=True)

Simpel funktion til hybrid søgning, der kombinerer BM25-score og cosinus-lighed med en vægt alpha.

Oprindelse

Sammensat af 'hybrid' (fra latin hybrida, 'af blandet oprindelse') og 'søgningsmetode' (metode til at søge).