BiGRU

forkortelse for Bidirectional Gated Recurrent Unit

En BiGRU er et neuralt netværk bestående af to GRU'er, der læser en inputsekvens henholdsvis forfra og bagfra og sammenkæder deres skjulte tilstande for at fange kontekst fra begge retninger.

Kort fortalt

Kort fortalt: En BiGRU er en type neuralt netværk, der forstår en sætning ved at læse den både fra start til slut og fra slut til start på samme tid.

Kategori: arkitektur
Niveau: øvet
Udtale: /baɪˈɡruː/

Betydninger

1
En neural netværksarkitektur, der kombinerer to Gated Recurrent Units (GRU'er) til at bearbejde sekvensdata i både fremadrettet og bagudrettet retning og sammenkæder deres output for at opnå en komplet kontekstuel repræsentation.
- BiGRU-modellen opnåede state-of-the-art resultater på sentimentanalyse-tasken ved at udnytte kontekst fra begge sider af hvert ord. — forskningsartikel, 2021
- I navnegenkendelse kan en BiGRU fange afhængigheder mellem ord uanset deres position i sætningen. — tutorial, 2020

Hvornår bruges det

BiGRU'er anvendes ofte i naturlig sprogbehandling (NLP) til opgaver som tekstklassifikation, sentimentanalyse, maskinoversættelse og navnegenkendelse, hvor kontekst fra begge sider af et ord er afgørende. De er særligt nyttige, når hele sætningen er tilgængelig på én gang, som i tekstbehandling, modsat streaming-data.

Kodeeksempel

from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Embedding, Bidirectional, GRU, Dense

model = Sequential()
model.add(Embedding(input_dim=10000, output_dim=128))
model.add(Bidirectional(GRU(64)))
model.add(Dense(1, activation='sigmoid'))
model.compile(optimizer='adam', loss='binary_crossentropy', metrics=['accuracy'])

Oprettelse af en BiGRU-model i Keras til tekstklassifikation med indlejring.

Oprindelse

BiGRU er en sammentrækning af 'Bidirectional Gated Recurrent Unit'. Introduceret som en udvidelse af GRU, der behandler sekvenser i begge retninger.

Kilder

Learning Phrase Representations using RNN Encoder-Decoder for Statistical Machine Translation (2014)
Bidirectional recurrent neural networks (1997)

Ressourcer

Ingen ressourcer endnu — del en video, artikel eller PDF om begrebet.

Se også

Mere

Flere i arkitektur →Tilfældigt opslag →