RAG-generator
Den generative del af et RAG-system, typisk en stor sprogmodel, der producerer svar baseret på kontekst fra en retriever.
Kort fortalt
RAG-generatoren er den del af RAG, der tager de hentede dokumenter og skriver et svar.
- Kategori
- arkitektur
- Niveau
- øvet
- Udtale
- [ˈʁɑɡ ɡ̊enəˈʁɑːtˢɐ]
Betydninger
1- 1
Den generative komponent i en RAG-arkitektur, der tager imod dokumenter fra retrieveren og en brugeranmodning og genererer et sprogligt svar.
- RAG-generatoren kan være baseret på en finjusteret GPT-model, der modtager dokumenter i prompten. — Lewis et al. (2020)
Hvornår bruges det
RAG-generatoren anvendes i RAG-systemer til at syntetisere information fra flere kilder til et sammenhængende svar. Den kombinerer modelsprogviden med ekstern viden for at reducere hallucinationer.
Kodeeksempel
from langchain.chains import RetrievalQA
from langchain.llms import OpenAI
from langchain.retrievers import ...
generator = OpenAI(model='gpt-3.5-turbo')
qa_chain = RetrievalQA.from_chain_type(llm=generator, retriever=retriever)
response = qa_chain.run('query')
print(response)Eksempel på brug af en RAG-generator via LangChain, hvor generatoren er en OpenAI-model.
Oprindelse
Termen kommer af 'Retrieval-Augmented Generation' og 'generator', da den udgør den generative komponent.