bi-GRU

forkortelse for bidirectional Gated Recurrent Unit

bi-GRU er en arkitektur, hvor to GRU'er (Gated Recurrent Units) behandler en sekvens i hver sin retning for at opfange kontekst fra både fortid og fremtid.

Kort fortalt

bi-GRU er en type neuralnetværk, der læser en tekst både forfra og bagfra for bedre at forstå sammenhængen.

Kategori
arkitektur
Niveau
øvet
Udtale
/ˌbaɪ.daɪˈrɛk.ʃən.əl ˌdʒiː ɑːr ˈjuː/

Betydninger

1
  1. 1

    En type rekurent neuralt netværk (RNN), der består af to GRU-lag: ét, der læser sekvensen forlæns, og ét, der læser den baglæns. Outputtet er en kombination af de to lag, hvilket giver adgang til både tidligere og fremtidig kontekst på hvert tidspunkt.

    • I opgaven med navnegenkendelse opnåede modellen en høj F1-score ved brug af et bi-GRU-lag over ordindlejringerne.Forskningsartikel om NER, 2019
    • Bi-GRU er ofte at foretrække frem for envejs-GRU, når der er behov for kontekst fra begge sider af en sekvens.

Hvornår bruges det

bi-GRU anvendes typisk inden for naturlig sprogbehandling, f.eks. til navnegenkendelse, sentimentanalyse og maskinoversættelse, hvor det er vigtigt at have kontekst fra begge sider af et ord.

Kodeeksempel

from tensorflow.keras.layers import Bidirectional, GRU
model.add(Bidirectional(GRU(units=128, return_sequences=True), input_shape=(None, 300)))

Oprettelse af et bi-GRU-lag i Keras med 128 enheder, der returnerer hele sekvensen.

Oprindelse

GRU (Gated Recurrent Unit) blev introduceret af Cho et al. i 2014 som en forenkling af LSTM. Bi-GRU er en variant, der kombinerer to GRU'er for at behandle sekvenser i begge retninger.

Afledte ord

1

Kilder

2