værdialignment

Værdialignment betegner problemstillingen med at sikre, at kunstig intelligens handler i overensstemmelse med menneskelige værdier og intentioner.

Kort fortalt

Kort sagt handler værdialignment om at få AI til at gøre det, vi faktisk ønsker, og undgå utilsigtede skadelige handlinger.

Kategori
begreb
Niveau
øvet
Udtale
[ˈvæɐ̯di.aˌlajnmənt]

Betydninger

1
  1. 1

    Problemstillingen med at designe kunstig intelligens, så den handler i overensstemmelse med menneskelige værdier, normer og intentioner, især når den opererer i komplekse og uforudsigelige situationer.

    • En central udfordring inden for værdialignment er at undgå, at en autonom AI fortolker et mål på en måde, der fører til skadelige konsekvenser.Forskningsartikel, 2023
    • Problemet med værdialignment bliver særligt akut, hvis AI-systemer opnår supermenneskelig intelligens.Nick Bostrom, Superintelligence, 2014

Hvornår bruges det

Værdialignment er centralt i udviklingen af avancerede AI-systemer, især når systemerne bliver mere autonome. Det involverer både tekniske metoder til at specificere værdier og etiske overvejelser om, hvilke værdier der skal lægges til grund.

Oprindelse

Udtrykket stammer fra engelsk 'value alignment' og er blevet fremtrædende inden for AI-sikkerhedsforskning, især omkring 2010'erne.

Afledte ord

2

Kilder

3
  • Superintelligence: Paths, Dangers, Strategies (2014)
  • Concrete Problems in AI Safety (2016)
  • The Alignment Problem (Brian Christian, 2020)