retriever

En komponent i et RAG-system (Retrieval-Augmented Generation) der henter relevante dokumenter eller informationer fra en stor samling baseret på en forespørgsel.

Kort fortalt

En retriever er en søgemaskine til AI-modeller: den finder de mest relevante stykker information, når du stiller et spørgsmål.

Kategori
arkitektur
Niveau
øvet
Udtale
/rɪˈtriːvər/

Betydninger

1
  1. 1

    En komponent i et RAG-system der ud fra en forespørgsel finder de mest relevante stykker tekst eller data i en forudindekseret samling.

    • Retrieveren i systemet bruger dense embeddings til at finde de bedste dokumenter til spørgsmålet.Eksempel fra praksis
    • En effektiv retriever reducerer mængden af data, som sprogmodellen skal behandle.Eksempel fra praksis

Hvornår bruges det

Retrieveren bruges i RAG-systemer til at indhente kontekst fra en ekstern vidensbase, som så sendes til en sprogmodel for at generere et svar. Den kan implementeres med forskellige metoder, fx BM25 (baseret på nøgleord) eller dense retrieval (baseret på embeddings). Typisk anvendes den i spørgsmål-svar-systemer, chatbots og informationssøgning.

Kodeeksempel

from langchain.retrievers import WikipediaRetriever
retriever = WikipediaRetriever()
docs = retriever.get_relevant_documents("Hvad er RAG?")

Eksempel på brug af en retriever i LangChain til at hente relevante Wikipedia-artikler.

Oprindelse

Fra engelsk 'retrieve' (hente) + '-er' (agentiv). Begrebet blev almindeligt i AI-sammenhæng med RAG-papiret i 2020.

Afledte ord

2

Kilder

2