offline feature store
Et offline feature store er et centralt lager til lagring, styring og genfinding af features, der er optimeret til batch-processering, typisk brugt under modeltræning og evaluering.
Kort fortalt
Kort fortalt: Et offline feature store er et system, der gemmer og serverer features til træningsjob, hvor data behandles i batches i stedet for i realtid.
- Kategori
- begreb
- Niveau
- øvet
Betydninger
1- 1
Et offline feature store er et specialiseret datalager designet til at gemme og levere maskinlæringsfeatures i batch-form, typisk til modeltræning, evaluering og batch-inferens. Det understøtter historiske forespørgsler og tidsbaseret join-funktionalitet for at sikre konsistente feature-datasæt.
- Før træning af den nye model hentede vi alle relevante features fra det offline feature store med et punkt-i-tiden join.
- Offline feature store reducerer redundans ved at centralisere feature-beregning og -lagring, så features kan genbruges på tværs af projekter.
Hvornår bruges det
Offline feature stores anvendes primært i machine learning-pipelines til at gemme historiske feature-data, der kan genbruges på tværs af modeller og teams. De understøtter typisk tidsseriebaserede forespørgsler (point-in-time queries) for at undgå data leakage og sikre korrekt feature-engineering til træning. I modsætning til online feature stores, som serverer features med lav latenstid til inferens, fokuserer offline feature stores på høj gennemstrømning og batch-læsning.
Oprindelse
Begrebet opstod med fremkomsten af feature store-koncepter som en del af MLOps-bevægelsen, hvor man skelnede mellem online- og offline-brugsscenarier. Ordet 'offline' refererer til batch- eller ikke-realtidsprocessering.