CAI-justering
forkortelse for konversationel AI-justering (Conversational AI Alignment)
Proces med at tilpasse en konversationel AI's adfærd til menneskelige forventninger, sikkerhedsretningslinjer eller specifikke opgaver.
Kort fortalt
At finjustere en chatbot, så den svarer passende og sikkert.
- Kategori
- teknik
- Niveau
- øvet
Betydninger
1- 1
Tilpasning af en konversationel AI's adfærd gennem teknikker som forstærkningslæring fra menneskelig feedback (RLHF) eller overvåget finjustering for at opnå ønskede svar, sikkerhed og brugervenlighed.
- Efter CAI-justering producerede chatbotten markant færre upassende svar.
- CAI-justering er afgørende for at implementere sprogmodeller i kundeservice.
Hvornår bruges det
CAI-justering bruges typisk efter prætræning af en stor sprogmodel for at forbedre dens samtaleevner, mindske skadelige output og sikre overholdelse af etiske retningslinjer. Teknikker som RLHF og instruktionsfinjustering anvendes ofte.
Oprindelse
Forkortelsen CAI står for 'conversational artificial intelligence', og 'justering' er det danske ord for alignment. Termen er en direkte oversættelse af det engelske begreb 'conversational AI alignment'.
Kilder
2- Training language models to follow instructions with human feedback (Ouyang et al., 2022)
- Constitutional AI: Harmlessness from AI Feedback (Bai et al., 2022)