Vector database
En specialiseret database optimeret til lagring og søgning af vektorembeddinger.
Kort fortalt
En database der gemmer data som vektorer, så den kan finde lignende elementer ved hjælp af afstandsberegning.
- Kategori
- værktøj
- Niveau
- øvet
Betydninger
1- 1
Et databasesystem der gemmer data som vektorembeddinger og understøtter effektiv lighedssøgning (approximate nearest neighbor search) ved hjælp af indekseringsmetoder som HNSW, IVF eller PQ.
- Pinecone er en af de mest populære vector databases til production.
- I en RAG-pipeline bruges en vector database til at gemme og søge i dokumentembeddinger.
Hvornår bruges det
Bruges i AI-systemer til semantisk søgning, anbefalingssystemer og RAG-pipelines, hvor man hurtigt skal finde de mest relevante dokumenter eller objekter baseret på en forespørgselsvektor.
Kodeeksempel
import vector_db_client
client = vector_db_client.connect()
client.upsert(vectors=[(id, embedding)]) # store vectors
results = client.query(query_vector, top_k=5) # find nearest neighborsSimpelt eksempel på brug af en vector database til lagring og forespørgsel af vektorer.
Oprindelse
Termen stammer fra kombinationen af 'vektor' (en matematisk repræsentation) og 'database' (organiseret datalager).