instruktionsfinjustering
Instruktionsfinjustering er en træningsmetode, hvor en fortrænet sprogmodel finjusteres på et datasæt af instruktion-svar-par for at forbedre modellens evne til at følge instruktioner.
Kort fortalt
En teknik, der lærer en sprogmodel at forstå og udføre opgaver baseret på menneskelige instruktioner ved at træne den på eksempler.
- Kategori
- teknik
- Niveau
- øvet
Betydninger
1- 1
En proces, hvor en fortrænet sprogmodel eftertrænes på et datasæt bestående af (instruktion, svar)-par, ofte genereret af mennesker, for at lære modellen at følge brugerens anvisninger på tværs af forskellige domæner.
- Efter instruktionsfinjustering kunne modellen besvare spørgsmål om historie, skrive digte og oversætte tekster baseret på enkle instruktioner. — Eksempel fra AI Ordbog
- Instruktionsfinjustering forbedrede markant modellens ydeevne på hidtil usete opgaver uden behov for opgavespecifik træning. — Eksempel fra AI Ordbog
Hvornår bruges det
Instruktionsfinjustering anvendes typisk efter en indledende fortræning og eventuelt overvåget finjustering for at gøre modellen bedre til at generalisere til nye opgaver og følge brugernes anvisninger i dialogbaserede systemer. Det er en central del af udviklingen af assistenter som ChatGPT.
Oprindelse
Termen er en direkte oversættelse af engelsk 'instruction fine-tuning', sammensat af 'instruktion' (instruktion) og 'finjustering' (fine-tuning). Metoden blev populær med udgivelsen af InstructGPT fra OpenAI i 2022.