CAI-justering

forkortelse for konversationel AI-justering (Conversational AI Alignment)

Proces med at tilpasse en konversationel AI's adfærd til menneskelige forventninger, sikkerhedsretningslinjer eller specifikke opgaver.

Kort fortalt

At finjustere en chatbot, så den svarer passende og sikkert.

Kategori
teknik
Niveau
øvet

Betydninger

1
  1. 1

    Tilpasning af en konversationel AI's adfærd gennem teknikker som forstærkningslæring fra menneskelig feedback (RLHF) eller overvåget finjustering for at opnå ønskede svar, sikkerhed og brugervenlighed.

    • Efter CAI-justering producerede chatbotten markant færre upassende svar.
    • CAI-justering er afgørende for at implementere sprogmodeller i kundeservice.

Hvornår bruges det

CAI-justering bruges typisk efter prætræning af en stor sprogmodel for at forbedre dens samtaleevner, mindske skadelige output og sikre overholdelse af etiske retningslinjer. Teknikker som RLHF og instruktionsfinjustering anvendes ofte.

Oprindelse

Forkortelsen CAI står for 'conversational artificial intelligence', og 'justering' er det danske ord for alignment. Termen er en direkte oversættelse af det engelske begreb 'conversational AI alignment'.

Kilder

2
  • Training language models to follow instructions with human feedback (Ouyang et al., 2022)
  • Constitutional AI: Harmlessness from AI Feedback (Bai et al., 2022)