parameter-effektiv finjustering
Parameter-effektiv finjustering (PEFT) refererer til en klasse af metoder, der finjusterer store fortrænede modeller ved kun at opdatere et lille antal parametre, mens resten forbliver frosne.
Kort fortalt
En måde at tilpasse en stor AI-model til en ny opgave uden at skulle genoptræne hele modellen – kun en lille del ændres.
- Kategori
- teknik
- Niveau
- øvet
Betydninger
1- 1
Samling af teknikker til effektiv finjustering af store sprogmodeller, hvor kun en lille delmængde af parametrene opdateres, hvilket reducerer beregningsomkostninger og hukommelsesforbrug betydeligt.
- Parameter-effektiv finjustering gør det muligt at tilpasse GPT-3 til specifikke opgaver uden at gemme en fuld kopi af modellen for hver opgave.
- LoRA er en af de mest populære PEFT-metoder; den indsætter trænelige rang-dekomponerede matricer i transformerlagene. — Hu et al., 2021
Hvornår bruges det
PEFT anvendes når man har begrænsede beregningsressourcer, eller når man ønsker at bevare modelens generelle viden samtidig med at den specialiseres til en specifik opgave. Populære PEFT-teknikker omfatter LoRA, adapter-lag og prefix-tuning.
Kodeeksempel
from peft import LoraConfig, get_peft_model
from transformers import AutoModelForSeq2SeqLM
model = AutoModelForSeq2SeqLM.from_pretrained("t5-base")
lora_config = LoraConfig(
r=8,
lora_alpha=32,
target_modules=["q", "v"],
lora_dropout=0.1
)
model = get_peft_model(model, lora_config)Eksempel på anvendelse af LoRA via PEFT-biblioteket til at tilføje trænelige matricer i opmærksomhedslagene.
Oprindelse
Sammensat af 'parameter', 'effektiv' og 'finjustering', hvor 'finjustering' er en dansk oversættelse af 'fine-tuning'.