stacked LSTM

En arkitektur, hvor flere LSTM-lag stables oven på hinanden, så outputtet fra et lag sendes som input til det næste.

Kort fortalt

Stacked LSTM er en dybere model, der består af flere LSTM-lag, hvilket gør den i stand til at lære mere komplekse mønstre.

Kategori
arkitektur
Niveau
øvet
Udtale
/stækt ɛl ɛs tiː ɛm/

Betydninger

1
  1. 1

    Et neuralt netværk bestående af flere LSTM-lag, hvor hvert lag modtager output fra det foregående lag som input, hvilket øger modellens kapacitet til at fange hierarkiske tidsmæssige afhængigheder.

    • Stacked LSTMs har vist sig effektive til opgaver som maskinoversættelse og talegenkendelse.
    • Ved at stable flere LSTM-lag kan modellen lære repræsentationer på forskellige tidsmæssige skalaer.

Hvornår bruges det

Bruges typisk til tidsrækkeproblemer med høj kompleksitet, fx tale- eller tekstgenerering, hvor et enkelt lag ikke er tilstrækkeligt.

Kodeeksempel

from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import LSTM, Dense

model = Sequential()
model.add(LSTM(64, return_sequences=True, input_shape=(10, 1)))
model.add(LSTM(32))
model.add(Dense(1))

Eksempel på en stacked LSTM-model i Keras med to LSTM-lag. Det første lag returnerer hele sekvensen, det andet kun sidste output.

Oprindelse

Fra 'stacked' (stabling) og 'LSTM' (Long Short-Term Memory), introduceret som en udvidelse af LSTM-netværk.

Afledte ord

2

Kilder

2
  • Long Short-Term Memory
  • Speech Recognition with Deep Recurrent Neural Networks (Graves et al., 2013)