fortrænet model
En fortrænet model er en maskinlæringsmodel, der er trænet på et stort datasæt og derefter tilpasses til en specifik opgave gennem finjustering.
Kort fortalt
En fortrænet model er en model, der allerede har 'lært' grundlæggende mønstre fra enorme mængder data, så du kan bruge den som udgangspunkt for din egen opgave i stedet for at træne fra bunden.
- Kategori
- model
- Niveau
- begynder
Betydninger
1- 1
En maskinlæringsmodel (typisk et neuralt netværk) der allerede er trænet på et omfattende datasæt, og som derefter bruges som udgangspunkt for en anden opgave, ofte gennem finjustering.
- Vi anvender en fortrænet model som BERT til at klassificere danske tekster.
- Fortrænede modeller som ResNet er standard for billedgenkendingsopgaver.
Hvornår bruges det
Fortrænede modeller bruges i overførselslæring, hvor de først trænes på store generiske datasæt (f.eks. ImageNet til billeder eller Common Crawl til tekst) og derefter finjusteres med mindre, opgavespecifikke datasæt. De er standardpraksis inden for computer vision og naturlig sprogbehandling, da de reducerer behovet for store mængder annoterede data og beregningsressourcer.
Kodeeksempel
from transformers import BertModel, BertTokenizer
tokenizer = BertTokenizer.from_pretrained('bert-base-uncased')
model = BertModel.from_pretrained('bert-base-uncased')Indlæsning af en fortrænet BERT-model med Hugging Face Transformers.
Oprindelse
Udtrykket 'fortrænet model' opstod i forbindelse med overførselslæring, hvor modeller først trænes på en generel opgave inden de tilpasses en specifik opgave. Med fremkomsten af store modeller som BERT og GPT blev termen almindelig.