vektordatabasestyringssystem

Et databasesystem designet til effektiv lagring, indeksering og lighedssøgning af højdimensionelle vektorer.

Kort fortalt

En specialiseret database, der gemmer og søger efter vektorer (talrækker) i stedet for almindelig tekst eller tal.

Kategori
værktøj
Niveau
øvet
Udtale
ˈvɛktɒˌdæːtəbɑːsəˌstʏːʁɪŋsystˌeːm

Betydninger

1
  1. 1

    Et databasesystem der optimerer lagring, indeksering og forespørgsler af vektordata, typisk med fokus på lighedssøgning (ANN).

    • Vektordatabasestyringssystemet understøtter både brute-force og approximate nearest neighbor søgning.
    • Mange moderne RAG-systemer er bygget oven på et vektordatabasestyringssystem som Milvus eller Pinecone.

Hvornår bruges det

Bruges især i AI-applikationer til semantisk søgning, fx i RAG-systemer, billedgenkendelse eller anbefalingssystemer, hvor embeddings sammenlignes for at finde lignende objekter.

Kodeeksempel

import chromadb
client = chromadb.Client()
collection = client.create_collection("my_vectors")
collection.add(
    embeddings=[[0.1, 0.2, 0.3], [0.4, 0.5, 0.6]],
    documents=["tekst A", "tekst B"]
)
results = collection.query(query_embeddings=[[0.1, 0.2, 0.3]], n_results=2)

Eksempel på brug af ChromaDB, et populært vektordatabasestyringssystem: opret en collection, indsæt embeddings og dokumenter, og søg efter lignende.

Oprindelse

Sammensat af 'vektor', 'database' og 'styringssystem', efter engelsk 'vector database management system'.

Afledte ord

2

Kilder

2