cosinus-afstand
Cosinus-afstand måler forskellen mellem to vektorer som 1 minus cosinus-ligheden, hvor værdien går fra 0 (identisk retning) til 2 (modsat retning).
Kort fortalt
Cosinus-afstand fortæller, hvor forskellige to vektorer er baseret på vinklen mellem dem, uden at tage højde for deres længde.
- Kategori
- metrik
- Niveau
- øvet
- Udtale
- /koˈsiːnus afˌstandˀ/
Betydninger
1- 1
Et mål for forskellen mellem to vektorer, beregnet som 1 minus cosinus af vinklen mellem dem.
- Cosinus-afstanden mellem de to embeddings er 0.2, hvilket indikerer høj lighed.
- Ved hjælp af cosinus-afstand kan vi identificere de mest forskellige dokumenter i et korpus.
Hvornår bruges det
Cosinus-afstand bruges ofte i tekstanalyse, anbefalingssystemer og clustering, hvor vektorernes størrelse ikke er vigtig. Det er almindeligt at beregne cosinus-afstanden mellem embeddings for at finde lignende dokumenter eller elementer.
Formel
cosine_distance = 1 - cos(θ) = 1 - (A·B) / (||A|| ||B||)Kodeeksempel
import numpy as np
def cosine_distance(a, b):
return 1 - np.dot(a, b) / (np.linalg.norm(a) * np.linalg.norm(b))
vec1 = np.array([1, 2, 3])
vec2 = np.array([4, 5, 6])
print(cosine_distance(vec1, vec2))Simpel implementering af cosinus-afstand i Python ved hjælp af NumPy.
Oprindelse
Termen er sammensat af 'cosinus' (den matematiske funktion) og 'afstand' (måling af forskel).