AI-sikkerhed

AI-sikkerhed er forskning og praksis, der sigter mod at sikre, at kunstig intelligens-systemer handler i overensstemmelse med menneskelige værdier og ikke forårsager utilsigtet skade.

Kort fortalt

At gøre AI-systemer sikre og pålidelige, så de ikke gør noget uventet farligt.

Kategori
begreb
Niveau
begynder
Udtale
ˈɛjˌajˈsikəˌheðˀ

Betydninger

2
  1. 1

    Den tekniske og operationelle sikkerhed af AI-systemer, der sikrer pålidelighed, robusthed og fravær af utilsigtede handlinger.

    • AI-sikkerhed kræver omfattende test af systemet under forskellige scenarier.
    • Et centralt mål for AI-sikkerhed er at undgå katastrofale fejl i autonome systemer.
  2. 2

    Den etiske og værdimæssige dimension af AI-sikkerhed, der handler om at justere AI-mål med menneskelige værdier og langsigtede samfundsmæssige konsekvenser.

    • AI-sikkerhed omfatter alignment-forskning, der sikrer, at AI-modeller ikke udvikler skadelige mål.
    • Debatten om AI-sikkerhed handler ofte om risikoen for superintelligens.

Hvornår bruges det

AI-sikkerhed bruges i udvikling og regulering af AI-systemer, især avancerede modeller. Det omfatter teknikker som alignment, robusthed og overvågning.

Oprindelse

Termen opstod i starten af 2000'erne med fokus på langsigtede risici ved superintelligens, men er nu bredere.

Afledte ord

2

Kilder

3
  • Concrete Problems in AI Safety (Amodei et al., 2016)
  • Superintelligence: Paths, Dangers, Strategies (Bostrom, 2014)
  • Research Priorities for Robust and Beneficial Artificial Intelligence (Russell et al., 2015)