target model
Den model der er genstand for optimering, træning eller tilpasning, i modsætning til en reference-, kilde- eller lærer-model.
Kort fortalt
Target modellen er den model, du forsøger at træne eller forbedre – fx eleven i viden-destillation.
- Kategori
- model
- Niveau
- øvet
Betydninger
1- 1
Den model der er genstand for træning, optimering eller tilpasning, typisk i kontrast til en kilde- eller lærer-model, der leverer viden eller mål.
- Under viden-destillation fungerer elevmodellen som target model, mens lærermodellen er kilde-modellen. — Hinton et al., 2015
- I DQN opdateres det online netværk mod et frosset target netværk, der er en kopi af target modellen. — Mnih et al., 2013
Hvornår bruges det
Begrebet bruges ofte i forbindelse med viden-destillation, hvor target-modellen er eleven, i reinforcement learning som target-netværk til stabile Q-learning-opdateringer, og ved fine-tuning, hvor target-modellen tilpasses en ny opgave. Det står i kontrast til en kilde- eller lærer-model, som leverer viden eller mål.
Afledte ord
3Kilder
2- Distilling the Knowledge in a Neural Network (Hinton et al., 2015)
- Playing Atari with Deep Reinforcement Learning (Mnih et al., 2013)