offline feature store

Et offline feature store er et centralt lager til lagring, styring og genfinding af features, der er optimeret til batch-processering, typisk brugt under modeltræning og evaluering.

Kort fortalt

Kort fortalt: Et offline feature store er et system, der gemmer og serverer features til træningsjob, hvor data behandles i batches i stedet for i realtid.

Kategori
begreb
Niveau
øvet

Betydninger

1
  1. 1

    Et offline feature store er et specialiseret datalager designet til at gemme og levere maskinlæringsfeatures i batch-form, typisk til modeltræning, evaluering og batch-inferens. Det understøtter historiske forespørgsler og tidsbaseret join-funktionalitet for at sikre konsistente feature-datasæt.

    • Før træning af den nye model hentede vi alle relevante features fra det offline feature store med et punkt-i-tiden join.
    • Offline feature store reducerer redundans ved at centralisere feature-beregning og -lagring, så features kan genbruges på tværs af projekter.

Hvornår bruges det

Offline feature stores anvendes primært i machine learning-pipelines til at gemme historiske feature-data, der kan genbruges på tværs af modeller og teams. De understøtter typisk tidsseriebaserede forespørgsler (point-in-time queries) for at undgå data leakage og sikre korrekt feature-engineering til træning. I modsætning til online feature stores, som serverer features med lav latenstid til inferens, fokuserer offline feature stores på høj gennemstrømning og batch-læsning.

Oprindelse

Begrebet opstod med fremkomsten af feature store-koncepter som en del af MLOps-bevægelsen, hvor man skelnede mellem online- og offline-brugsscenarier. Ordet 'offline' refererer til batch- eller ikke-realtidsprocessering.