modelkomprimering
Teknikker til at reducere størrelsen og beregningsomkostningen af en AI-model uden væsentligt tab af nøjagtighed.
- Kategori
- teknik
- Niveau
- øvet
Betydninger
1- 1
Samling af metoder som beskæring (pruning), kvantisering (quantization) og viden-destillation (knowledge distillation), der anvendes for at gøre modeller hurtigere og mere hukommelseseffektive, især til implementering på ressourcebegrænsede enheder.
- Modelkomprimering er afgørende for at kunne køre store sprogmodeller på mobile enheder. — forskningsartikel, 2023
- Ved at anvende kvantisering som en form for modelkomprimering kan vi reducere modellens størrelse med 75% uden væsentlig præcisionstab. — industrirapport, 2022
Oprindelse
Sammensat af 'model' (fra latin modulus, 'målestok') og 'komprimering' (fra latin comprimere, 'trykke sammen').