guardrails-politik
En politik eller sæt af regler, der definerer acceptable grænser for en AI-systemets adfærd og output.
Kort fortalt
En guardrails-politik er et regelsæt, der afgrænser, hvad en AI må og ikke må gøre.
- Kategori
- begreb
- Niveau
- øvet
Betydninger
1- 1
Et dokumenteret sæt af regler og procedurer, der specificerer de operationelle grænser for et AI-system, herunder input- og outputrestriktioner, etiske retningslinjer og overvågningsmekanismer.
- Virksomheden implementerede en guardrails-politik for at forhindre sprogmodellen i at generere skadeligt indhold. — AI-sikkerhedsrapport, 2024
- Guardrails-politikken kræver menneskelig godkendelse af alle output, der overstiger en vis risikoscore. — Eksempel fra praksis
Hvornår bruges det
Guardrails-politikker anvendes af organisationer til at styre AI-systemer, især i kritiske eller regulerede domæner. De inkluderer ofte retningslinjer for indholdsmoderation, sikkerhedsbuffer og ansvarlighed.
Oprindelse
Sammensat af engelsk 'guardrails' (beskyttelsesgitre) og dansk 'politik', som et begreb fra AI-sikkerhedsdebatten.
Kilder
1- A Roadmap for Governing AI: Guardrails and Accountability