state

En intern repræsentation, som en model vedligeholder og opdaterer for at opsummere tidligere informationer i en sekvens eller beslutningsproces.

Kort fortalt

Et 'øjebliksbillede' af den information, en AI-model har samlet indtil nu, som den bruger til at forudsige eller træffe beslutninger.

Kategori: begreb
Niveau: øvet
Udtale: /steɪt/

Betydninger

1
Skjult tilstand (hidden state) i et rekursivt neuralt netværk (RNN); en vektor der komprimerer information om tidligere input og bæres frem til næste tidsskridt.
- RNN'ens skjulte state opdateres for hvert nyt ord i sætningen.
2
I forstærkningslæring: en repræsentation af miljøet på et givet tidspunkt, der indeholder al relevant information for beslutningstagning.
- Agenten vælger en handling baseret på den nuværende state og den forventede belønning.
3
I transformermodeller: key-value-cachen der gemmes under autoregressiv generering for at undgå genberegning af tidligere tokens.
- Under tekstgenerering holder transformeren en state med tidligere keys og values, så kun det nye token skal behandles fuldt ud.

Hvornår bruges det

Inden for deep learning bruges state især i rekursive neurale netværk (RNN'er), hvor den skjulte state overfører kontekst mellem tidsskridt. I transformermodeller refererer state til key-value-cachen, der genbruges under autoregressiv generering. I forstærkningslæring er state en beskrivelse af miljøet på et givet tidspunkt, der bruges til at vælge handlinger.

Kodeeksempel

hidden_state = torch.zeros(batch_size, hidden_dim)
for x in input_sequence:
    hidden_state = rnn_cell(x, hidden_state)

Illustrerer hvordan en skjult state opdateres for hvert element i en sekvens i et RNN.

Oprindelse

Fra latin 'status' (tilstand, stilling). Termen anvendes i datalogi og AI til at beskrive en opsamlet mængde information på et givet tidspunkt.

Afledte ord

hidden state state space state vector

Kilder

Deep Learning (Goodfellow et al., 2016)
Reinforcement Learning: An Introduction (Sutton & Barto, 2018)
Attention Is All You Need (Vaswani et al., 2017)

Ressourcer

Ingen ressourcer endnu — del en video, artikel eller PDF om begrebet.

Se også

Mere

Flere i begreb →Tilfældigt opslag →