checkpoint-fil
En checkpoint-fil er en lagret tilstand af en model under træning, der indeholder vægte, optimeringstilstand og metadata.
Kort fortalt
En checkpoint-fil gemmer en models fremskridt under træning, så du kan genoptage træningen senere eller bruge modellen til inferens.
- Kategori
- træning
- Niveau
- øvet
Betydninger
1- 1
En fil, der indeholder en snapshot af en maskinlæringsmodels tilstand, typisk inkluderende modelvægte, optimeringsparametre og eventuelle ekstra metadata såsom epoke- eller batch-nummer.
- Efter hver epoke gemmes en checkpoint-fil, så træningen kan genoptages ved nedbrud. — AI Ordbog
- Ved inferens kan man indlæse den bedste checkpoint-fil fra validering. — AI Ordbog
Hvornår bruges det
Checkpoint-filer bruges typisk til at gemme modellen efter et antal epoker eller ved tidlig stop. De gør det muligt at genoptage træning efter afbrydelse eller at evaluere forskellige træningsstadier.
Kodeeksempel
# PyTorch: gem checkpoint
torch.save({
'epoch': epoch,
'model_state_dict': model.state_dict(),
'optimizer_state_dict': optimizer.state_dict(),
'loss': loss,
}, 'checkpoint.pth')
# Indlæs checkpoint
checkpoint = torch.load('checkpoint.pth')
model.load_state_dict(checkpoint['model_state_dict'])
optimizer.load_state_dict(checkpoint['optimizer_state_dict'])Eksempel på at gemme og indlæse en checkpoint-fil med PyTorch.
Oprindelse
Fra engelsk 'checkpoint', der betyder kontrolpunkt, og 'fil'.