modelkomprimering

Teknikker til at reducere størrelsen og beregningsomkostningen af en AI-model uden væsentligt tab af nøjagtighed.

Betydninger

1
Samling af metoder som beskæring (pruning), kvantisering (quantization) og viden-destillation (knowledge distillation), der anvendes for at gøre modeller hurtigere og mere hukommelseseffektive, især til implementering på ressourcebegrænsede enheder.
- Modelkomprimering er afgørende for at kunne køre store sprogmodeller på mobile enheder. — forskningsartikel, 2023
- Ved at anvende kvantisering som en form for modelkomprimering kan vi reducere modellens størrelse med 75% uden væsentlig præcisionstab. — industrirapport, 2022

Sammensat af 'model' (fra latin modulus, 'målestok') og 'komprimering' (fra latin comprimere, 'trykke sammen').

Ingen ressourcer endnu — del en video, artikel eller PDF om begrebet.

Se også

Mere