AI-sikkerhed

AI-sikkerhed er forskning og praksis, der sigter mod at sikre, at kunstig intelligens-systemer handler i overensstemmelse med menneskelige værdier og ikke forårsager utilsigtet skade.

Kort fortalt

At gøre AI-systemer sikre og pålidelige, så de ikke gør noget uventet farligt.

Kategori: begreb
Niveau: begynder
Udtale: ˈɛjˌajˈsikəˌheðˀ

Betydninger

1
Den tekniske og operationelle sikkerhed af AI-systemer, der sikrer pålidelighed, robusthed og fravær af utilsigtede handlinger.
- AI-sikkerhed kræver omfattende test af systemet under forskellige scenarier.
- Et centralt mål for AI-sikkerhed er at undgå katastrofale fejl i autonome systemer.
2
Den etiske og værdimæssige dimension af AI-sikkerhed, der handler om at justere AI-mål med menneskelige værdier og langsigtede samfundsmæssige konsekvenser.
- AI-sikkerhed omfatter alignment-forskning, der sikrer, at AI-modeller ikke udvikler skadelige mål.
- Debatten om AI-sikkerhed handler ofte om risikoen for superintelligens.

Hvornår bruges det

AI-sikkerhed bruges i udvikling og regulering af AI-systemer, især avancerede modeller. Det omfatter teknikker som alignment, robusthed og overvågning.

Oprindelse

Termen opstod i starten af 2000'erne med fokus på langsigtede risici ved superintelligens, men er nu bredere.

Afledte ord

AI-sikkerhedsforskning AI-sikkerhedsforanstaltning

Kilder

Concrete Problems in AI Safety (Amodei et al., 2016)
Superintelligence: Paths, Dangers, Strategies (Bostrom, 2014)
Research Priorities for Robust and Beneficial Artificial Intelligence (Russell et al., 2015)

Ressourcer

Ingen ressourcer endnu — del en video, artikel eller PDF om begrebet.

Se også

Mere

Flere i begreb →Tilfældigt opslag →