RAG-generator

Den generative del af et RAG-system, typisk en stor sprogmodel, der producerer svar baseret på kontekst fra en retriever.

Kort fortalt

RAG-generatoren er den del af RAG, der tager de hentede dokumenter og skriver et svar.

Kategori: arkitektur
Niveau: øvet
Udtale: [ˈʁɑɡ ɡ̊enəˈʁɑːtˢɐ]

Betydninger

1
Den generative komponent i en RAG-arkitektur, der tager imod dokumenter fra retrieveren og en brugeranmodning og genererer et sprogligt svar.
- RAG-generatoren kan være baseret på en finjusteret GPT-model, der modtager dokumenter i prompten. — Lewis et al. (2020)

Hvornår bruges det

RAG-generatoren anvendes i RAG-systemer til at syntetisere information fra flere kilder til et sammenhængende svar. Den kombinerer modelsprogviden med ekstern viden for at reducere hallucinationer.

Kodeeksempel

from langchain.chains import RetrievalQA
from langchain.llms import OpenAI
from langchain.retrievers import ...

generator = OpenAI(model='gpt-3.5-turbo')
qa_chain = RetrievalQA.from_chain_type(llm=generator, retriever=retriever)
response = qa_chain.run('query')
print(response)

Eksempel på brug af en RAG-generator via LangChain, hvor generatoren er en OpenAI-model.

Oprindelse

Termen kommer af 'Retrieval-Augmented Generation' og 'generator', da den udgør den generative komponent.

Kilder

Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks

Ressourcer

Ingen ressourcer endnu — del en video, artikel eller PDF om begrebet.

Se også

Mere

Flere i arkitektur →Tilfældigt opslag →