modelkomprimering

Teknikker til at reducere størrelsen og beregningsomkostningen af en AI-model uden væsentligt tab af nøjagtighed.

Kategori
teknik
Niveau
øvet

Betydninger

1
  1. 1

    Samling af metoder som beskæring (pruning), kvantisering (quantization) og viden-destillation (knowledge distillation), der anvendes for at gøre modeller hurtigere og mere hukommelseseffektive, især til implementering på ressourcebegrænsede enheder.

    • Modelkomprimering er afgørende for at kunne køre store sprogmodeller på mobile enheder.forskningsartikel, 2023
    • Ved at anvende kvantisering som en form for modelkomprimering kan vi reducere modellens størrelse med 75% uden væsentlig præcisionstab.industrirapport, 2022

Oprindelse

Sammensat af 'model' (fra latin modulus, 'målestok') og 'komprimering' (fra latin comprimere, 'trykke sammen').

Afledte ord

1