stacked LSTM

En arkitektur, hvor flere LSTM-lag stables oven på hinanden, så outputtet fra et lag sendes som input til det næste.

Kort fortalt

Stacked LSTM er en dybere model, der består af flere LSTM-lag, hvilket gør den i stand til at lære mere komplekse mønstre.

Kategori: arkitektur
Niveau: øvet
Udtale: /stækt ɛl ɛs tiː ɛm/

Betydninger

1
Et neuralt netværk bestående af flere LSTM-lag, hvor hvert lag modtager output fra det foregående lag som input, hvilket øger modellens kapacitet til at fange hierarkiske tidsmæssige afhængigheder.
- Stacked LSTMs har vist sig effektive til opgaver som maskinoversættelse og talegenkendelse.
- Ved at stable flere LSTM-lag kan modellen lære repræsentationer på forskellige tidsmæssige skalaer.

Hvornår bruges det

Bruges typisk til tidsrækkeproblemer med høj kompleksitet, fx tale- eller tekstgenerering, hvor et enkelt lag ikke er tilstrækkeligt.

Kodeeksempel

from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import LSTM, Dense

model = Sequential()
model.add(LSTM(64, return_sequences=True, input_shape=(10, 1)))
model.add(LSTM(32))
model.add(Dense(1))

Eksempel på en stacked LSTM-model i Keras med to LSTM-lag. Det første lag returnerer hele sekvensen, det andet kun sidste output.

Oprindelse

Fra 'stacked' (stabling) og 'LSTM' (Long Short-Term Memory), introduceret som en udvidelse af LSTM-netværk.

Afledte ord

stacked bidirectional LSTM deep LSTM

Kilder

Long Short-Term Memory
Speech Recognition with Deep Recurrent Neural Networks (Graves et al., 2013)

Ressourcer

Ingen ressourcer endnu — del en video, artikel eller PDF om begrebet.

Se også

Mere

Flere i arkitektur →Tilfældigt opslag →