guardrails-politik

En politik eller sæt af regler, der definerer acceptable grænser for en AI-systemets adfærd og output.

Kort fortalt

En guardrails-politik er et regelsæt, der afgrænser, hvad en AI må og ikke må gøre.

Kategori
begreb
Niveau
øvet

Betydninger

1
  1. 1

    Et dokumenteret sæt af regler og procedurer, der specificerer de operationelle grænser for et AI-system, herunder input- og outputrestriktioner, etiske retningslinjer og overvågningsmekanismer.

    • Virksomheden implementerede en guardrails-politik for at forhindre sprogmodellen i at generere skadeligt indhold.AI-sikkerhedsrapport, 2024
    • Guardrails-politikken kræver menneskelig godkendelse af alle output, der overstiger en vis risikoscore.Eksempel fra praksis

Hvornår bruges det

Guardrails-politikker anvendes af organisationer til at styre AI-systemer, især i kritiske eller regulerede domæner. De inkluderer ofte retningslinjer for indholdsmoderation, sikkerhedsbuffer og ansvarlighed.

Oprindelse

Sammensat af engelsk 'guardrails' (beskyttelsesgitre) og dansk 'politik', som et begreb fra AI-sikkerhedsdebatten.

Kilder

1
  • A Roadmap for Governing AI: Guardrails and Accountability