Vector database

En specialiseret database optimeret til lagring og søgning af vektorembeddinger.

Kort fortalt

En database der gemmer data som vektorer, så den kan finde lignende elementer ved hjælp af afstandsberegning.

Kategori
værktøj
Niveau
øvet

Betydninger

1
  1. 1

    Et databasesystem der gemmer data som vektorembeddinger og understøtter effektiv lighedssøgning (approximate nearest neighbor search) ved hjælp af indekseringsmetoder som HNSW, IVF eller PQ.

    • Pinecone er en af de mest populære vector databases til production.
    • I en RAG-pipeline bruges en vector database til at gemme og søge i dokumentembeddinger.

Hvornår bruges det

Bruges i AI-systemer til semantisk søgning, anbefalingssystemer og RAG-pipelines, hvor man hurtigt skal finde de mest relevante dokumenter eller objekter baseret på en forespørgselsvektor.

Kodeeksempel

import vector_db_client
client = vector_db_client.connect()
client.upsert(vectors=[(id, embedding)])  # store vectors
results = client.query(query_vector, top_k=5)  # find nearest neighbors

Simpelt eksempel på brug af en vector database til lagring og forespørgsel af vektorer.

Oprindelse

Termen stammer fra kombinationen af 'vektor' (en matematisk repræsentation) og 'database' (organiseret datalager).

Afledte ord

2