parameter-effektiv finjustering

Parameter-effektiv finjustering (PEFT) refererer til en klasse af metoder, der finjusterer store fortrænede modeller ved kun at opdatere et lille antal parametre, mens resten forbliver frosne.

Kort fortalt

En måde at tilpasse en stor AI-model til en ny opgave uden at skulle genoptræne hele modellen – kun en lille del ændres.

Kategori: teknik
Niveau: øvet

Betydninger

1
Samling af teknikker til effektiv finjustering af store sprogmodeller, hvor kun en lille delmængde af parametrene opdateres, hvilket reducerer beregningsomkostninger og hukommelsesforbrug betydeligt.
- Parameter-effektiv finjustering gør det muligt at tilpasse GPT-3 til specifikke opgaver uden at gemme en fuld kopi af modellen for hver opgave.
- LoRA er en af de mest populære PEFT-metoder; den indsætter trænelige rang-dekomponerede matricer i transformerlagene. — Hu et al., 2021

Hvornår bruges det

PEFT anvendes når man har begrænsede beregningsressourcer, eller når man ønsker at bevare modelens generelle viden samtidig med at den specialiseres til en specifik opgave. Populære PEFT-teknikker omfatter LoRA, adapter-lag og prefix-tuning.

Kodeeksempel

from peft import LoraConfig, get_peft_model
from transformers import AutoModelForSeq2SeqLM

model = AutoModelForSeq2SeqLM.from_pretrained("t5-base")
lora_config = LoraConfig(
    r=8,
    lora_alpha=32,
    target_modules=["q", "v"],
    lora_dropout=0.1
)
model = get_peft_model(model, lora_config)

Eksempel på anvendelse af LoRA via PEFT-biblioteket til at tilføje trænelige matricer i opmærksomhedslagene.

Oprindelse

Sammensat af 'parameter', 'effektiv' og 'finjustering', hvor 'finjustering' er en dansk oversættelse af 'fine-tuning'.

Kilder

Ressourcer

Ingen ressourcer endnu — del en video, artikel eller PDF om begrebet.

Se også

Mere

Flere i teknik →Tilfældigt opslag →