BiGRU
forkortelse for Bidirectional Gated Recurrent Unit
En BiGRU er et neuralt netværk bestående af to GRU'er, der læser en inputsekvens henholdsvis forfra og bagfra og sammenkæder deres skjulte tilstande for at fange kontekst fra begge retninger.
Kort fortalt
Kort fortalt: En BiGRU er en type neuralt netværk, der forstår en sætning ved at læse den både fra start til slut og fra slut til start på samme tid.
- Kategori
- arkitektur
- Niveau
- øvet
- Udtale
- /baɪˈɡruː/
Betydninger
1- 1
En neural netværksarkitektur, der kombinerer to Gated Recurrent Units (GRU'er) til at bearbejde sekvensdata i både fremadrettet og bagudrettet retning og sammenkæder deres output for at opnå en komplet kontekstuel repræsentation.
- BiGRU-modellen opnåede state-of-the-art resultater på sentimentanalyse-tasken ved at udnytte kontekst fra begge sider af hvert ord. — forskningsartikel, 2021
- I navnegenkendelse kan en BiGRU fange afhængigheder mellem ord uanset deres position i sætningen. — tutorial, 2020
Hvornår bruges det
BiGRU'er anvendes ofte i naturlig sprogbehandling (NLP) til opgaver som tekstklassifikation, sentimentanalyse, maskinoversættelse og navnegenkendelse, hvor kontekst fra begge sider af et ord er afgørende. De er særligt nyttige, når hele sætningen er tilgængelig på én gang, som i tekstbehandling, modsat streaming-data.
Kodeeksempel
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Embedding, Bidirectional, GRU, Dense
model = Sequential()
model.add(Embedding(input_dim=10000, output_dim=128))
model.add(Bidirectional(GRU(64)))
model.add(Dense(1, activation='sigmoid'))
model.compile(optimizer='adam', loss='binary_crossentropy', metrics=['accuracy'])Oprettelse af en BiGRU-model i Keras til tekstklassifikation med indlejring.
Oprindelse
BiGRU er en sammentrækning af 'Bidirectional Gated Recurrent Unit'. Introduceret som en udvidelse af GRU, der behandler sekvenser i begge retninger.
Kilder
2- Learning Phrase Representations using RNN Encoder-Decoder for Statistical Machine Translation (2014)
- Bidirectional recurrent neural networks (1997)