stacked LSTM
En arkitektur, hvor flere LSTM-lag stables oven på hinanden, så outputtet fra et lag sendes som input til det næste.
Kort fortalt
Stacked LSTM er en dybere model, der består af flere LSTM-lag, hvilket gør den i stand til at lære mere komplekse mønstre.
- Kategori
- arkitektur
- Niveau
- øvet
- Udtale
- /stækt ɛl ɛs tiː ɛm/
Betydninger
1- 1
Et neuralt netværk bestående af flere LSTM-lag, hvor hvert lag modtager output fra det foregående lag som input, hvilket øger modellens kapacitet til at fange hierarkiske tidsmæssige afhængigheder.
- Stacked LSTMs har vist sig effektive til opgaver som maskinoversættelse og talegenkendelse.
- Ved at stable flere LSTM-lag kan modellen lære repræsentationer på forskellige tidsmæssige skalaer.
Hvornår bruges det
Bruges typisk til tidsrækkeproblemer med høj kompleksitet, fx tale- eller tekstgenerering, hvor et enkelt lag ikke er tilstrækkeligt.
Kodeeksempel
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import LSTM, Dense
model = Sequential()
model.add(LSTM(64, return_sequences=True, input_shape=(10, 1)))
model.add(LSTM(32))
model.add(Dense(1))Eksempel på en stacked LSTM-model i Keras med to LSTM-lag. Det første lag returnerer hele sekvensen, det andet kun sidste output.
Oprindelse
Fra 'stacked' (stabling) og 'LSTM' (Long Short-Term Memory), introduceret som en udvidelse af LSTM-netværk.
Afledte ord
2Kilder
2- Long Short-Term Memory
- Speech Recognition with Deep Recurrent Neural Networks (Graves et al., 2013)