RAG-model

forkortelse for Retrieval-Augmented Generation model

En RAG-model er en sprogmodel, der kombinerer en generator med en ekstern vidensbase via hentning for at forbedre kvaliteten og relevansen af genererede svar.

Kort fortalt

En RAG-model henter relevant information fra en database, før den genererer et svar, så den ikke kun stoler på sin egen trænede viden.

Kategori
teknik
Niveau
øvet

Betydninger

1
  1. 1

    En modelarkitektur, der integrerer en retriever og en generator, typisk baseret på transformere, så genereringen kan trække på eksterne dokumenter.

    • RAG-modellen henter først relevante dokumenter fra en korpus og genererer derefter et svar baseret på dem.Forskningsartikel, 2020
    • Ved at anvende en RAG-model kan man reducere hallucinationer i sprogmodeller.

Hvornår bruges det

RAG-modeller anvendes i chatbotter og QA-systemer, hvor nøjagtig og opdateret viden er afgørende, fx i kundeservice eller forskning.

Kodeeksempel

from transformers import RagTokenizer, RagRetriever, RagModel

tokenizer = RagTokenizer.from_pretrained("facebook/rag-token-base")
retriever = RagRetriever.from_pretrained("facebook/rag-token-base")
model = RagModel.from_pretrained("facebook/rag-token-base")

input_ids = tokenizer("What is the capital of France?", return_tensors="pt").input_ids
outputs = model.generate(input_ids)
print(tokenizer.decode(outputs[0]))

Eksempel på indlæsning og brug af en RAG-model fra Hugging Face.

Oprindelse

Begrebet 'Retrieval-Augmented Generation' blev introduceret af Lewis et al. i 2020.

Afledte ord

3

Kilder

1
  • Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks (Lewis et al., 2020)