checkpoint-fil

En checkpoint-fil er en lagret tilstand af en model under træning, der indeholder vægte, optimeringstilstand og metadata.

Kort fortalt

En checkpoint-fil gemmer en models fremskridt under træning, så du kan genoptage træningen senere eller bruge modellen til inferens.

Kategori
træning
Niveau
øvet

Betydninger

1
  1. 1

    En fil, der indeholder en snapshot af en maskinlæringsmodels tilstand, typisk inkluderende modelvægte, optimeringsparametre og eventuelle ekstra metadata såsom epoke- eller batch-nummer.

    • Efter hver epoke gemmes en checkpoint-fil, så træningen kan genoptages ved nedbrud.AI Ordbog
    • Ved inferens kan man indlæse den bedste checkpoint-fil fra validering.AI Ordbog

Hvornår bruges det

Checkpoint-filer bruges typisk til at gemme modellen efter et antal epoker eller ved tidlig stop. De gør det muligt at genoptage træning efter afbrydelse eller at evaluere forskellige træningsstadier.

Kodeeksempel

# PyTorch: gem checkpoint
torch.save({
    'epoch': epoch,
    'model_state_dict': model.state_dict(),
    'optimizer_state_dict': optimizer.state_dict(),
    'loss': loss,
}, 'checkpoint.pth')

# Indlæs checkpoint
checkpoint = torch.load('checkpoint.pth')
model.load_state_dict(checkpoint['model_state_dict'])
optimizer.load_state_dict(checkpoint['optimizer_state_dict'])

Eksempel på at gemme og indlæse en checkpoint-fil med PyTorch.

Oprindelse

Fra engelsk 'checkpoint', der betyder kontrolpunkt, og 'fil'.