seq2seq-model

forkortelse for sequence-to-sequence model

En modelarkitektur, der transformerer en inputsekvens til en outputsekvens via en encoder og en decoder, typisk baseret på RNN'er eller transformere.

Kort fortalt

En seq2seq-model er en slags AI, der kan tage en sætning på ét sprog og oversætte den til et andet, eller generere en tekst ud fra en anden.

Kategori
arkitektur
Niveau
øvet

Betydninger

1
  1. 1

    En modelarkitektur bestående af en encoder, der læser inputsekvensen og producerer en kontekstvektor, og en decoder, der genererer outputsekvensen sekvensielt, ofte med brug af RNN'er eller transformere og attention-mekanismer.

    • Den klassiske seq2seq-model til maskinoversættelse bruger to LSTM-netværk.Sutskever et al., 2014
    • Seq2seq-modeller med attention kan håndtere længere sætninger end dem uden.Bahdanau et al., 2015

Hvornår bruges det

Bruges inden for oversættelse, tekstsammenfatning, dialoggenerering og andre opgaver, hvor input og output er sekvenser. Ofte kombineret med attention-mekanismer for at håndtere lange sekvenser.

Oprindelse

Udtrykket 'seq2seq' er en forkortelse for 'sequence-to-sequence' og blev populært af Sutskever et al. i 2014.

Kilder

2
  • Sequence to Sequence Learning with Neural Networks (Sutskever et al., 2014)
  • Neural Machine Translation by Jointly Learning to Align and Translate (Bahdanau et al., 2015)