RAG-model
forkortelse for Retrieval-Augmented Generation model
En RAG-model er en sprogmodel, der kombinerer en generator med en ekstern vidensbase via hentning for at forbedre kvaliteten og relevansen af genererede svar.
Kort fortalt
En RAG-model henter relevant information fra en database, før den genererer et svar, så den ikke kun stoler på sin egen trænede viden.
- Kategori
- teknik
- Niveau
- øvet
Betydninger
1- 1
En modelarkitektur, der integrerer en retriever og en generator, typisk baseret på transformere, så genereringen kan trække på eksterne dokumenter.
- RAG-modellen henter først relevante dokumenter fra en korpus og genererer derefter et svar baseret på dem. — Forskningsartikel, 2020
- Ved at anvende en RAG-model kan man reducere hallucinationer i sprogmodeller.
Hvornår bruges det
RAG-modeller anvendes i chatbotter og QA-systemer, hvor nøjagtig og opdateret viden er afgørende, fx i kundeservice eller forskning.
Kodeeksempel
from transformers import RagTokenizer, RagRetriever, RagModel
tokenizer = RagTokenizer.from_pretrained("facebook/rag-token-base")
retriever = RagRetriever.from_pretrained("facebook/rag-token-base")
model = RagModel.from_pretrained("facebook/rag-token-base")
input_ids = tokenizer("What is the capital of France?", return_tensors="pt").input_ids
outputs = model.generate(input_ids)
print(tokenizer.decode(outputs[0]))Eksempel på indlæsning og brug af en RAG-model fra Hugging Face.
Oprindelse
Begrebet 'Retrieval-Augmented Generation' blev introduceret af Lewis et al. i 2020.
Afledte ord
3Kilder
1- Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks (Lewis et al., 2020)