cosine distance

Cosine distance er et mål for forskellen mellem to vektorer, defineret som 1 minus cosinus af vinklen mellem dem.

Kort fortalt

Cosine distance siger, hvor forskellige to embeddings er – jo tættere på 0, desto mere ens.

Kategori
metrik
Niveau
øvet
Udtale
/ˈkoʊsaɪn ˈdɪstəns/

Betydninger

1
  1. 1

    Et afstandsmål mellem to ikke-nul-vektorer i et indre-produktrum, beregnet som 1 minus cosinus af vinklen mellem dem.

    • Cosine distance mellem ordet 'kat' og 'hund' i et ord-embedding-rum er 0.15.
    • For at finde de mest ens dokumenter beregner man cosine distance mellem deres vektorrepræsentationer.

Hvornår bruges det

Bruges i søgning og clustering til at måle modsætningen til cosine similarity. Anvendes ofte med embeddings i NLP og anbefalingssystemer.

Formel

cosine_distance(A,B) = 1 - cos(θ) = 1 - (A·B)/(||A||·||B||)

Oprindelse

'Cosine' (cosinus) fra trigonometri, 'distance' (afstand) – kombineret til afstandsmål baseret på vinkel.