seq2seq-model

forkortelse for sequence-to-sequence model

En modelarkitektur, der transformerer en inputsekvens til en outputsekvens via en encoder og en decoder, typisk baseret på RNN'er eller transformere.

Kort fortalt

En seq2seq-model er en slags AI, der kan tage en sætning på ét sprog og oversætte den til et andet, eller generere en tekst ud fra en anden.

Kategori: arkitektur
Niveau: øvet

Betydninger

1
En modelarkitektur bestående af en encoder, der læser inputsekvensen og producerer en kontekstvektor, og en decoder, der genererer outputsekvensen sekvensielt, ofte med brug af RNN'er eller transformere og attention-mekanismer.
- Den klassiske seq2seq-model til maskinoversættelse bruger to LSTM-netværk. — Sutskever et al., 2014
- Seq2seq-modeller med attention kan håndtere længere sætninger end dem uden. — Bahdanau et al., 2015

Hvornår bruges det

Bruges inden for oversættelse, tekstsammenfatning, dialoggenerering og andre opgaver, hvor input og output er sekvenser. Ofte kombineret med attention-mekanismer for at håndtere lange sekvenser.

Oprindelse

Udtrykket 'seq2seq' er en forkortelse for 'sequence-to-sequence' og blev populært af Sutskever et al. i 2014.

Kilder

Sequence to Sequence Learning with Neural Networks (Sutskever et al., 2014)
Neural Machine Translation by Jointly Learning to Align and Translate (Bahdanau et al., 2015)

Ressourcer

Ingen ressourcer endnu — del en video, artikel eller PDF om begrebet.

Se også

Mere

Flere i arkitektur →Tilfældigt opslag →