state

En intern repræsentation, som en model vedligeholder og opdaterer for at opsummere tidligere informationer i en sekvens eller beslutningsproces.

Kort fortalt

Et 'øjebliksbillede' af den information, en AI-model har samlet indtil nu, som den bruger til at forudsige eller træffe beslutninger.

Kategori
begreb
Niveau
øvet
Udtale
/steɪt/

Betydninger

3
  1. 1

    Skjult tilstand (hidden state) i et rekursivt neuralt netværk (RNN); en vektor der komprimerer information om tidligere input og bæres frem til næste tidsskridt.

    • RNN'ens skjulte state opdateres for hvert nyt ord i sætningen.
  2. 2

    I forstærkningslæring: en repræsentation af miljøet på et givet tidspunkt, der indeholder al relevant information for beslutningstagning.

    • Agenten vælger en handling baseret på den nuværende state og den forventede belønning.
  3. 3

    I transformermodeller: key-value-cachen der gemmes under autoregressiv generering for at undgå genberegning af tidligere tokens.

    • Under tekstgenerering holder transformeren en state med tidligere keys og values, så kun det nye token skal behandles fuldt ud.

Hvornår bruges det

Inden for deep learning bruges state især i rekursive neurale netværk (RNN'er), hvor den skjulte state overfører kontekst mellem tidsskridt. I transformermodeller refererer state til key-value-cachen, der genbruges under autoregressiv generering. I forstærkningslæring er state en beskrivelse af miljøet på et givet tidspunkt, der bruges til at vælge handlinger.

Kodeeksempel

hidden_state = torch.zeros(batch_size, hidden_dim)
for x in input_sequence:
    hidden_state = rnn_cell(x, hidden_state)

Illustrerer hvordan en skjult state opdateres for hvert element i en sekvens i et RNN.

Oprindelse

Fra latin 'status' (tilstand, stilling). Termen anvendes i datalogi og AI til at beskrive en opsamlet mængde information på et givet tidspunkt.

Afledte ord

3

Kilder

3
  • Deep Learning (Goodfellow et al., 2016)
  • Reinforcement Learning: An Introduction (Sutton & Barto, 2018)
  • Attention Is All You Need (Vaswani et al., 2017)