hybrid søgningsmetode
En søgningsmetode der kombinerer traditionel nøgleordsbaseret søgning (fx BM25) med semantisk søgning baseret på vektorembeddings for at forbedre relevansen.
Kort fortalt
Hybrid søgning bruger både nøgleord og betydning til at finde de bedste resultater, så man får det bedste fra begge verdener.
- Kategori
- teknik
- Niveau
- øvet
Betydninger
1- 1
Kombination af nøgleordsbaseret og semantisk søgning for at forbedre genfindingskvaliteten i informationssystemer.
- Hybrid søgningsmetode forbedrer recall ved at fange dokumenter, der matcher både nøgleord og begreber. — faglitteratur, 2024
- Systemet anvender en hybrid søgningsmetode, der vægter BM25 og vektorsøgning ligeligt. — dokumentation, 2023
Hvornår bruges det
Hybrid søgning anvendes i RAG-systemer og informationsgenfinding, hvor man ønsker at kombinere præcisionen fra nøgleordssøgning med forståelsen fra semantisk søgning. Det implementeres typisk ved at fusionere scores fra to eller flere retrieval-modeller.
Kodeeksempel
def hybrid_search(query, bm25_index, embedding_model, documents, alpha=0.5):
bm25_scores = bm25_index.get_scores(query)
query_emb = embedding_model.encode(query)
doc_embs = embedding_model.encode(documents)
cos_scores = cosine_similarity(query_emb, doc_embs)[0]
hybrid_scores = alpha * bm25_scores + (1 - alpha) * cos_scores
return sorted(zip(documents, hybrid_scores), key=lambda x: x[1], reverse=True)Simpel funktion til hybrid søgning, der kombinerer BM25-score og cosinus-lighed med en vægt alpha.
Oprindelse
Sammensat af 'hybrid' (fra latin hybrida, 'af blandet oprindelse') og 'søgningsmetode' (metode til at søge).