target model

Den model der er genstand for optimering, træning eller tilpasning, i modsætning til en reference-, kilde- eller lærer-model.

Kort fortalt

Target modellen er den model, du forsøger at træne eller forbedre – fx eleven i viden-destillation.

Kategori
model
Niveau
øvet

Betydninger

1
  1. 1

    Den model der er genstand for træning, optimering eller tilpasning, typisk i kontrast til en kilde- eller lærer-model, der leverer viden eller mål.

    • Under viden-destillation fungerer elevmodellen som target model, mens lærermodellen er kilde-modellen.Hinton et al., 2015
    • I DQN opdateres det online netværk mod et frosset target netværk, der er en kopi af target modellen.Mnih et al., 2013

Hvornår bruges det

Begrebet bruges ofte i forbindelse med viden-destillation, hvor target-modellen er eleven, i reinforcement learning som target-netværk til stabile Q-learning-opdateringer, og ved fine-tuning, hvor target-modellen tilpasses en ny opgave. Det står i kontrast til en kilde- eller lærer-model, som leverer viden eller mål.

Afledte ord

3

Kilder

2
  • Distilling the Knowledge in a Neural Network (Hinton et al., 2015)
  • Playing Atari with Deep Reinforcement Learning (Mnih et al., 2013)