logit-score
Den rå, unormaliserede værdi som en model producerer før anvendelse af en aktiveringsfunktion som softmax, ofte brugt til at repræsentere sandsynlighedslog-odds.
Kort fortalt
En logit-score er et mål for, hvor meget en model 'synes om' en bestemt klasse eller et bestemt token, før den omregnes til en sandsynlighed.
- Kategori
- begreb
- Niveau
- øvet
- Udtale
- /ˈlɒɡɪt skɔːr/
Betydninger
2- 1
Den rå udgangsværdi fra et lineært lag i en neuralt netværk, før en aktiveringsfunktion som softmax anvendes. Logit-scores kan antage enhver reel værdi og omdannes til sandsynligheder via softmax.
- Modellens logit-score for klassen 'kat' var 3.2, mens den for 'hund' var -1.5, hvilket efter softmax gav høj sandsynlighed for 'kat'. — Eksempel fra praksis
- 2
I sprogmodeller den værdi, som modellen tildeler hvert token i ordforrådet før softmax, brugt til at vælge næste token i genereringen.
- Ved generering af tekst sammenlignes logit-scores for alle tokens, og det token med højeste logit-score (efter eventuel temperaturjustering) vælges ofte. — Eksempel fra praksis
Hvornår bruges det
Logit-scores anvendes typisk i klassifikationsmodeller (f.eks. softmax-klassifikatorer) og i sprogmodeller til at bestemme næste token. Ofte manipuleres logitterne med temperatur eller top-k sampling før softmax.
Formel
logit_i = w_i · x + b_iKodeeksempel
import numpy as np
logits = np.array([2.0, 1.0, 0.1])
probs = np.exp(logits) / np.sum(np.exp(logits))
print(probs) # [0.659, 0.242, 0.099]Eksempel på konvertering af logit-scores til sandsynligheder med softmax.
Oprindelse
Ordet 'logit' er en sammentrækning af 'logistic unit' og refererer til log-odds i logistisk regression. 'Score' angiver en numerisk værdi.
Afledte ord
3Kilder
2- Goodfellow, I., Bengio, Y., & Courville, A. (2016). Deep Learning.
- Vaswani, A., et al. (2017). Attention Is All You Need.