encoder-only model

En transformer-baseret model bestående udelukkende af encoder-stakken, som genererer en kontekstafhængig repræsentation af inputsekvensen.

Kort fortalt

En model der kun bruger enkoderdelen af transformeren, typisk til at forstå og klassificere tekst.

Kategori: arkitektur
Niveau: øvet

Betydninger

1
En transformerarkitektur bestående af flere encoderlag, der anvender selvopmærksomhed til at skabe en kontekstualiseret repræsentation af inputsekvensen, typisk brugt til forståelsesopgaver.
- BERT er en populær encoder-only model, der har opnået state-of-the-art resultater på mange NLP-opgaver.

Hvornår bruges det

Encoder-only modeller som BERT bruges til opgaver som tekstklassifikation, navnegenkendelse og spørgsmålsbesvarelse, hvor hele inputsekvensen skal forstås.

Kodeeksempel

from transformers import BertModel, BertTokenizer

tokenizer = BertTokenizer.from_pretrained('bert-base-uncased')
model = BertModel.from_pretrained('bert-base-uncased')

inputs = tokenizer("Hello, world!", return_tensors="pt")
outputs = model(**inputs)
last_hidden_state = outputs.last_hidden_state

Eksempel på indlæsning af BERT (en encoder-only model) og anvendelse på en tekst.

Oprindelse

Betegnelsen kommer fra transformerarkitekturen, hvor 'encoder' refererer til den del, der behandler inputtet, og 'only' angiver fraværet af en decoder.

Afledte ord

BERT RoBERTa encoder

Kilder

Attention Is All You Need (Vaswani et al., 2017)
BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding (Devlin et al., 2019)

Ressourcer

Ingen ressourcer endnu — del en video, artikel eller PDF om begrebet.

Se også

Mere

Flere i arkitektur →Tilfældigt opslag →