PEFT-metode

forkortelse for Parameter-Efficient Fine-Tuning

PEFT-metoder er en familie af fine-tuning-teknikker, der kun opdaterer et lille antal parametre for at tilpasse en stor model til en specifik opgave.

Kort fortalt

I stedet for at genoptræne hele den store model, justerer PEFT-metoder kun en lille del af parametrene, hvilket sparer tid og kræfter.

Kategori: teknik
Niveau: øvet
Udtale: piː iː ɛf tiː

Betydninger

1
En samling af fine-tuning-teknikker, hvor kun en lille del af modelparametrene opdateres, mens resten af modellen forbliver frossen, hvilket reducerer beregnings- og lageromkostninger.
- Ved hjælp af en PEFT-metode som LoRA kan vi fine-tune en 7B-parameter model med kun 0,1% af parametrene. — Forskningsartikel, 2023
- PEFT-metoder gør det muligt at køre flere specialiserede versioner af én model på en enkelt GPU.

Hvornår bruges det

PEFT-metoder anvendes typisk til at tilpasse store sprogmodeller (LLM'er) til specifikke domæner eller opgaver, f.eks. oversættelse, tekstklassifikation eller chatbots, uden at skulle gemme en fuld kopi af modellen for hver opgave. De er særligt nyttige, når man har begrænset hardware eller ønsker at dele én basis-model mellem flere tilpasninger.

Kodeeksempel

from transformers import AutoModelForCausalLM
from peft import LoraConfig, get_peft_model

model = AutoModelForCausalLM.from_pretrained("gpt2")
lora_config = LoraConfig(r=8, lora_alpha=32, target_modules=["q_proj", "v_proj"])
peft_model = get_peft_model(model, lora_config)
print(f"Trænbare parametre: {peft_model.num_parameters(only_trainable=True)}")

Eksempel på at anvende LoRA (en PEFT-metode) på GPT-2 ved hjælp af Hugging Face PEFT-biblioteket. Kun query- og value-projektionerne gøres trænbare.

Oprindelse

Termen PEFT er et akronym for Parameter-Efficient Fine-Tuning, og stammer fra forskning i effektiv overførsel af store modeller. Det blev udbredt med introduktionen af metoder som LoRA og Adapters.

Afledte ord

PEFT-teknik PEFT-library

Kilder

Ressourcer

Ingen ressourcer endnu — del en video, artikel eller PDF om begrebet.

Se også

Mere

Flere i teknik →Tilfældigt opslag →