seq2seq-model
forkortelse for sequence-to-sequence model
En modelarkitektur, der transformerer en inputsekvens til en outputsekvens via en encoder og en decoder, typisk baseret på RNN'er eller transformere.
Kort fortalt
En seq2seq-model er en slags AI, der kan tage en sætning på ét sprog og oversætte den til et andet, eller generere en tekst ud fra en anden.
- Kategori
- arkitektur
- Niveau
- øvet
Betydninger
1- 1
En modelarkitektur bestående af en encoder, der læser inputsekvensen og producerer en kontekstvektor, og en decoder, der genererer outputsekvensen sekvensielt, ofte med brug af RNN'er eller transformere og attention-mekanismer.
- Den klassiske seq2seq-model til maskinoversættelse bruger to LSTM-netværk. — Sutskever et al., 2014
- Seq2seq-modeller med attention kan håndtere længere sætninger end dem uden. — Bahdanau et al., 2015
Hvornår bruges det
Bruges inden for oversættelse, tekstsammenfatning, dialoggenerering og andre opgaver, hvor input og output er sekvenser. Ofte kombineret med attention-mekanismer for at håndtere lange sekvenser.
Oprindelse
Udtrykket 'seq2seq' er en forkortelse for 'sequence-to-sequence' og blev populært af Sutskever et al. i 2014.
Kilder
2- Sequence to Sequence Learning with Neural Networks (Sutskever et al., 2014)
- Neural Machine Translation by Jointly Learning to Align and Translate (Bahdanau et al., 2015)