træning

Processen hvor en maskinlæringsmodel optimerer sine parametre ved at lære fra data gennem gentagne iterationer.

Kort fortalt

At træne en model er som at lære den at genkende mønstre i data, så den kan forudsige eller klassificere korrekt.

Kategori
begreb
Niveau
begynder
Udtale
/ˈtrɛːneŋ/

Betydninger

4
  1. 1

    Overvåget træning: Modellen lærer fra mærkede data, hvor hvert eksempel har en kendt outputværdi.

    • Træning af en klassifikationsmodel med et datasæt af katte- og hundebilleder kræver overvåget træning.Eksempel
  2. 2

    Uovervåget træning: Modellen finder strukturer i umærkede data uden foruddefinerede output.

    • Klyngeanalyse og dimensionsreduktion er typiske opgaver for uovervåget træning.Eksempel
  3. 3

    Forstærkningstræning: Modellen (agenten) lærer gennem belønninger og straf ved at interagere med et miljø.

    • Træning af en spil-AI med forstærkningstræning kræver mange episoder for at optimere politikken.Eksempel
  4. 4

    Træningsløkken: Den iterative proces med fremadretning, tabsberegning, baglænspropagation og parameteropdatering.

    • En typisk træningsløkke for en neural køres i et antal epoker med mini-batches.Eksempel

Hvornår bruges det

Træning er den centrale fase i udviklingen af AI-modeller. Det kræver et stort datasæt og en passende tabsfunktion, og processen styres ofte med gradient descent. Resultatet er trænede parametre, som kan bruges til inferens.

Formel

θ_{t+1} = θ_t - η ∇_θ L(θ_t)

Kodeeksempel

for epoch in range(num_epochs):
    for batch in dataloader:
        inputs, labels = batch
        outputs = model(inputs)
        loss = criterion(outputs, labels)
        optimizer.zero_grad()
        loss.backward()
        optimizer.step()

Grundlæggende træningsløkke i PyTorch: for hver epoke behandles batches, loss beregnes, og parametre opdateres.

Oprindelse

Fra engelsk 'training', afledt af 'train' (oplære, instruere), lånt fra fransk 'traîner' (trække, uddanne).

Afledte ord

4

Kilder

2
  • Deep Learning (Goodfellow, Bengio, Courville, 2016)
  • Pattern Recognition and Machine Learning (Bishop, 2006)