semantisk søgning

Semantisk søgning er en søgeteknik, der forstår brugerens hensigt og ordbetydning i stedet for at matche nøjagtige søgeord.

Kort fortalt

Søgning, der forstår hvad du mener, ikke bare hvad du skriver.

Kategori
teknik
Niveau
begynder

Betydninger

1
  1. 1

    En søgeteknik, hvor relevans bestemmes ud fra betydningsmæssig lighed mellem forespørgsel og dokumenter, ofte ved hjælp af neuronale netværk eller vektorrepræsentationer.

    • I stedet for at nøjes med nøjagtige ordmatch, anvender moderne søgemaskiner semantisk søgning til at levere mere relevante resultater.
    • RAG-systemer kombinerer semantisk søgning med en sprogmodel for at besvare spørgsmål baseret på en ekstern vidensbase.

Hvornår bruges det

Semantisk søgning bruges i moderne søgemaskiner, RAG-systemer og vidensbaser til at finde relevant information, selv når ordene ikke matcher præcist. Den anvender ofte embeddings til at repræsentere tekst i et vektorrum og måler afstande mellem forespørgsler og dokumenter.

Kodeeksempel

from sentence_transformers import SentenceTransformer, util

model = SentenceTransformer('all-MiniLM-L6-v2')
query = "Hvad er hovedstaden i Danmark?"
documents = ["København er Danmarks hovedstad.", "Paris er Frankrigs hovedstad."]
query_emb = model.encode(query)
doc_embs = model.encode(documents)
scores = util.cos_sim(query_emb, doc_embs)
best_idx = scores.argmax()
print(documents[best_idx])

Eksempel på semantisk søgning med embeddings: en forespørgsel matches mod dokumenter ved hjælp af cosinus-lighed.

Oprindelse

Fra 'semantik' (læren om betydning) og 'søgning'.

Afledte ord

1

Kilder

2
  • From Word Embeddings to Document Distances (2015)
  • Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks (2020)