RAG-model

forkortelse for Retrieval-Augmented Generation model

En RAG-model er en sprogmodel, der kombinerer en generator med en ekstern vidensbase via hentning for at forbedre kvaliteten og relevansen af genererede svar.

Kort fortalt

En RAG-model henter relevant information fra en database, før den genererer et svar, så den ikke kun stoler på sin egen trænede viden.

Kategori: teknik
Niveau: øvet

Betydninger

1
En modelarkitektur, der integrerer en retriever og en generator, typisk baseret på transformere, så genereringen kan trække på eksterne dokumenter.
- RAG-modellen henter først relevante dokumenter fra en korpus og genererer derefter et svar baseret på dem. — Forskningsartikel, 2020
- Ved at anvende en RAG-model kan man reducere hallucinationer i sprogmodeller.

Hvornår bruges det

RAG-modeller anvendes i chatbotter og QA-systemer, hvor nøjagtig og opdateret viden er afgørende, fx i kundeservice eller forskning.

Kodeeksempel

from transformers import RagTokenizer, RagRetriever, RagModel

tokenizer = RagTokenizer.from_pretrained("facebook/rag-token-base")
retriever = RagRetriever.from_pretrained("facebook/rag-token-base")
model = RagModel.from_pretrained("facebook/rag-token-base")

input_ids = tokenizer("What is the capital of France?", return_tensors="pt").input_ids
outputs = model.generate(input_ids)
print(tokenizer.decode(outputs[0]))

Eksempel på indlæsning og brug af en RAG-model fra Hugging Face.

Oprindelse

Begrebet 'Retrieval-Augmented Generation' blev introduceret af Lewis et al. i 2020.

Afledte ord

RAG-pipeline RAG-retriever RAG-generator

Kilder

Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks (Lewis et al., 2020)

Ressourcer

Ingen ressourcer endnu — del en video, artikel eller PDF om begrebet.

Se også

Mere

Flere i teknik →Tilfældigt opslag →