bi-GRU
forkortelse for bidirectional Gated Recurrent Unit
bi-GRU er en arkitektur, hvor to GRU'er (Gated Recurrent Units) behandler en sekvens i hver sin retning for at opfange kontekst fra både fortid og fremtid.
Kort fortalt
bi-GRU er en type neuralnetværk, der læser en tekst både forfra og bagfra for bedre at forstå sammenhængen.
- Kategori
- arkitektur
- Niveau
- øvet
- Udtale
- /ˌbaɪ.daɪˈrɛk.ʃən.əl ˌdʒiː ɑːr ˈjuː/
Betydninger
1- 1
En type rekurent neuralt netværk (RNN), der består af to GRU-lag: ét, der læser sekvensen forlæns, og ét, der læser den baglæns. Outputtet er en kombination af de to lag, hvilket giver adgang til både tidligere og fremtidig kontekst på hvert tidspunkt.
- I opgaven med navnegenkendelse opnåede modellen en høj F1-score ved brug af et bi-GRU-lag over ordindlejringerne. — Forskningsartikel om NER, 2019
- Bi-GRU er ofte at foretrække frem for envejs-GRU, når der er behov for kontekst fra begge sider af en sekvens.
Hvornår bruges det
bi-GRU anvendes typisk inden for naturlig sprogbehandling, f.eks. til navnegenkendelse, sentimentanalyse og maskinoversættelse, hvor det er vigtigt at have kontekst fra begge sider af et ord.
Kodeeksempel
from tensorflow.keras.layers import Bidirectional, GRU
model.add(Bidirectional(GRU(units=128, return_sequences=True), input_shape=(None, 300)))Oprettelse af et bi-GRU-lag i Keras med 128 enheder, der returnerer hele sekvensen.
Oprindelse
GRU (Gated Recurrent Unit) blev introduceret af Cho et al. i 2014 som en forenkling af LSTM. Bi-GRU er en variant, der kombinerer to GRU'er for at behandle sekvenser i begge retninger.