guardrails-politik

En politik eller sæt af regler, der definerer acceptable grænser for en AI-systemets adfærd og output.

Kort fortalt

En guardrails-politik er et regelsæt, der afgrænser, hvad en AI må og ikke må gøre.

Kategori: begreb
Niveau: øvet

Betydninger

1
Et dokumenteret sæt af regler og procedurer, der specificerer de operationelle grænser for et AI-system, herunder input- og outputrestriktioner, etiske retningslinjer og overvågningsmekanismer.
- Virksomheden implementerede en guardrails-politik for at forhindre sprogmodellen i at generere skadeligt indhold. — AI-sikkerhedsrapport, 2024
- Guardrails-politikken kræver menneskelig godkendelse af alle output, der overstiger en vis risikoscore. — Eksempel fra praksis

Hvornår bruges det

Guardrails-politikker anvendes af organisationer til at styre AI-systemer, især i kritiske eller regulerede domæner. De inkluderer ofte retningslinjer for indholdsmoderation, sikkerhedsbuffer og ansvarlighed.

Oprindelse

Sammensat af engelsk 'guardrails' (beskyttelsesgitre) og dansk 'politik', som et begreb fra AI-sikkerhedsdebatten.

Kilder

A Roadmap for Governing AI: Guardrails and Accountability

Ressourcer

Ingen ressourcer endnu — del en video, artikel eller PDF om begrebet.

Se også

Mere

Flere i begreb →Tilfældigt opslag →