Retrieval
Hentning af relevant information fra en ekstern kilde, typisk en vektordatabase eller et dokumentindeks.
Kort fortalt
Retrieval er processen med at finde og hente de mest relevante stykker information fra en stor samling, så en AI-model kan bruge dem til at give bedre svar.
- Kategori
- teknik
- Niveau
- begynder
- Udtale
- rɪˈtriːvəl
Betydninger
2- 1
Generel informationshentning: processen med at finde dokumenter eller data, der matcher en forespørgsel, ofte baseret på nøgleord eller semantisk lighed.
- Retrieval-systemet returnerede de fem mest relevante artikler baseret på brugerens søgning.
- Traditionel retrieval bruger BM25, mens moderne systemer ofte anvender dense retrieval med embeddings.
- 2
Retrieval i RAG-kontekst: komponenten der henter relevante tekststykker fra en ekstern vidensbase, som derefter gives til sprogmodellen som kontekst.
- I RAG-pipelinen starter retrieval med at omdanne forespørgslen til en embedding og søge efter de nærmeste naboer i vektordatabasen.
Hvornår bruges det
Retrieval bruges især i Retrieval-Augmented Generation (RAG) for at give sprogmodeller adgang til opdateret eller specialiseret viden uden at genoptræne dem. Det anvendes også i søgemaskiner, anbefalingssystemer og vidensbaserede chatbots.
Oprindelse
Fra engelsk 'retrieval', afledt af 'retrieve' (genfinde, hente). Brugt i informationsteknologi siden 1960'erne.
Afledte ord
3Kilder
2- A Survey on Retrieval-Augmented Text Generation for Large Language Models (2023)
- Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks (2020)