Retrieval

Hentning af relevant information fra en ekstern kilde, typisk en vektordatabase eller et dokumentindeks.

Kort fortalt

Retrieval er processen med at finde og hente de mest relevante stykker information fra en stor samling, så en AI-model kan bruge dem til at give bedre svar.

Kategori
teknik
Niveau
begynder
Udtale
rɪˈtriːvəl

Betydninger

2
  1. 1

    Generel informationshentning: processen med at finde dokumenter eller data, der matcher en forespørgsel, ofte baseret på nøgleord eller semantisk lighed.

    • Retrieval-systemet returnerede de fem mest relevante artikler baseret på brugerens søgning.
    • Traditionel retrieval bruger BM25, mens moderne systemer ofte anvender dense retrieval med embeddings.
  2. 2

    Retrieval i RAG-kontekst: komponenten der henter relevante tekststykker fra en ekstern vidensbase, som derefter gives til sprogmodellen som kontekst.

    • I RAG-pipelinen starter retrieval med at omdanne forespørgslen til en embedding og søge efter de nærmeste naboer i vektordatabasen.

Hvornår bruges det

Retrieval bruges især i Retrieval-Augmented Generation (RAG) for at give sprogmodeller adgang til opdateret eller specialiseret viden uden at genoptræne dem. Det anvendes også i søgemaskiner, anbefalingssystemer og vidensbaserede chatbots.

Oprindelse

Fra engelsk 'retrieval', afledt af 'retrieve' (genfinde, hente). Brugt i informationsteknologi siden 1960'erne.

Afledte ord

3

Kilder

2
  • A Survey on Retrieval-Augmented Text Generation for Large Language Models (2023)
  • Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks (2020)