instruktionsfinjustering

Instruktionsfinjustering er en træningsmetode, hvor en fortrænet sprogmodel finjusteres på et datasæt af instruktion-svar-par for at forbedre modellens evne til at følge instruktioner.

Kort fortalt

En teknik, der lærer en sprogmodel at forstå og udføre opgaver baseret på menneskelige instruktioner ved at træne den på eksempler.

Kategori
teknik
Niveau
øvet

Betydninger

1
  1. 1

    En proces, hvor en fortrænet sprogmodel eftertrænes på et datasæt bestående af (instruktion, svar)-par, ofte genereret af mennesker, for at lære modellen at følge brugerens anvisninger på tværs af forskellige domæner.

    • Efter instruktionsfinjustering kunne modellen besvare spørgsmål om historie, skrive digte og oversætte tekster baseret på enkle instruktioner.Eksempel fra AI Ordbog
    • Instruktionsfinjustering forbedrede markant modellens ydeevne på hidtil usete opgaver uden behov for opgavespecifik træning.Eksempel fra AI Ordbog

Hvornår bruges det

Instruktionsfinjustering anvendes typisk efter en indledende fortræning og eventuelt overvåget finjustering for at gøre modellen bedre til at generalisere til nye opgaver og følge brugernes anvisninger i dialogbaserede systemer. Det er en central del af udviklingen af assistenter som ChatGPT.

Oprindelse

Termen er en direkte oversættelse af engelsk 'instruction fine-tuning', sammensat af 'instruktion' (instruktion) og 'finjustering' (fine-tuning). Metoden blev populær med udgivelsen af InstructGPT fra OpenAI i 2022.

Afledte ord

2

Kilder

2