retriever
En komponent i et RAG-system (Retrieval-Augmented Generation) der henter relevante dokumenter eller informationer fra en stor samling baseret på en forespørgsel.
Kort fortalt
En retriever er en søgemaskine til AI-modeller: den finder de mest relevante stykker information, når du stiller et spørgsmål.
- Kategori
- arkitektur
- Niveau
- øvet
- Udtale
- /rɪˈtriːvər/
Betydninger
1- 1
En komponent i et RAG-system der ud fra en forespørgsel finder de mest relevante stykker tekst eller data i en forudindekseret samling.
- Retrieveren i systemet bruger dense embeddings til at finde de bedste dokumenter til spørgsmålet. — Eksempel fra praksis
- En effektiv retriever reducerer mængden af data, som sprogmodellen skal behandle. — Eksempel fra praksis
Hvornår bruges det
Retrieveren bruges i RAG-systemer til at indhente kontekst fra en ekstern vidensbase, som så sendes til en sprogmodel for at generere et svar. Den kan implementeres med forskellige metoder, fx BM25 (baseret på nøgleord) eller dense retrieval (baseret på embeddings). Typisk anvendes den i spørgsmål-svar-systemer, chatbots og informationssøgning.
Kodeeksempel
from langchain.retrievers import WikipediaRetriever
retriever = WikipediaRetriever()
docs = retriever.get_relevant_documents("Hvad er RAG?")Eksempel på brug af en retriever i LangChain til at hente relevante Wikipedia-artikler.
Oprindelse
Fra engelsk 'retrieve' (hente) + '-er' (agentiv). Begrebet blev almindeligt i AI-sammenhæng med RAG-papiret i 2020.