cosine distance
Cosine distance er et mål for forskellen mellem to vektorer, defineret som 1 minus cosinus af vinklen mellem dem.
Kort fortalt
Cosine distance siger, hvor forskellige to embeddings er – jo tættere på 0, desto mere ens.
- Kategori
- metrik
- Niveau
- øvet
- Udtale
- /ˈkoʊsaɪn ˈdɪstəns/
Betydninger
1- 1
Et afstandsmål mellem to ikke-nul-vektorer i et indre-produktrum, beregnet som 1 minus cosinus af vinklen mellem dem.
- Cosine distance mellem ordet 'kat' og 'hund' i et ord-embedding-rum er 0.15.
- For at finde de mest ens dokumenter beregner man cosine distance mellem deres vektorrepræsentationer.
Hvornår bruges det
Bruges i søgning og clustering til at måle modsætningen til cosine similarity. Anvendes ofte med embeddings i NLP og anbefalingssystemer.
Formel
cosine_distance(A,B) = 1 - cos(θ) = 1 - (A·B)/(||A||·||B||)Oprindelse
'Cosine' (cosinus) fra trigonometri, 'distance' (afstand) – kombineret til afstandsmål baseret på vinkel.