cosinus-afstand

Cosinus-afstand måler forskellen mellem to vektorer som 1 minus cosinus-ligheden, hvor værdien går fra 0 (identisk retning) til 2 (modsat retning).

Kort fortalt

Cosinus-afstand fortæller, hvor forskellige to vektorer er baseret på vinklen mellem dem, uden at tage højde for deres længde.

Kategori
metrik
Niveau
øvet
Udtale
/koˈsiːnus afˌstandˀ/

Betydninger

1
  1. 1

    Et mål for forskellen mellem to vektorer, beregnet som 1 minus cosinus af vinklen mellem dem.

    • Cosinus-afstanden mellem de to embeddings er 0.2, hvilket indikerer høj lighed.
    • Ved hjælp af cosinus-afstand kan vi identificere de mest forskellige dokumenter i et korpus.

Hvornår bruges det

Cosinus-afstand bruges ofte i tekstanalyse, anbefalingssystemer og clustering, hvor vektorernes størrelse ikke er vigtig. Det er almindeligt at beregne cosinus-afstanden mellem embeddings for at finde lignende dokumenter eller elementer.

Formel

cosine_distance = 1 - cos(θ) = 1 - (A·B) / (||A|| ||B||)

Kodeeksempel

import numpy as np
def cosine_distance(a, b):
    return 1 - np.dot(a, b) / (np.linalg.norm(a) * np.linalg.norm(b))

vec1 = np.array([1, 2, 3])
vec2 = np.array([4, 5, 6])
print(cosine_distance(vec1, vec2))

Simpel implementering af cosinus-afstand i Python ved hjælp af NumPy.

Oprindelse

Termen er sammensat af 'cosinus' (den matematiske funktion) og 'afstand' (måling af forskel).

Afledte ord

1