vektordatabasestyringssystem
Et databasesystem designet til effektiv lagring, indeksering og lighedssøgning af højdimensionelle vektorer.
Kort fortalt
En specialiseret database, der gemmer og søger efter vektorer (talrækker) i stedet for almindelig tekst eller tal.
- Kategori
- værktøj
- Niveau
- øvet
- Udtale
- ˈvɛktɒˌdæːtəbɑːsəˌstʏːʁɪŋsystˌeːm
Betydninger
1- 1
Et databasesystem der optimerer lagring, indeksering og forespørgsler af vektordata, typisk med fokus på lighedssøgning (ANN).
- Vektordatabasestyringssystemet understøtter både brute-force og approximate nearest neighbor søgning.
- Mange moderne RAG-systemer er bygget oven på et vektordatabasestyringssystem som Milvus eller Pinecone.
Hvornår bruges det
Bruges især i AI-applikationer til semantisk søgning, fx i RAG-systemer, billedgenkendelse eller anbefalingssystemer, hvor embeddings sammenlignes for at finde lignende objekter.
Kodeeksempel
import chromadb
client = chromadb.Client()
collection = client.create_collection("my_vectors")
collection.add(
embeddings=[[0.1, 0.2, 0.3], [0.4, 0.5, 0.6]],
documents=["tekst A", "tekst B"]
)
results = collection.query(query_embeddings=[[0.1, 0.2, 0.3]], n_results=2)Eksempel på brug af ChromaDB, et populært vektordatabasestyringssystem: opret en collection, indsæt embeddings og dokumenter, og søg efter lignende.
Oprindelse
Sammensat af 'vektor', 'database' og 'styringssystem', efter engelsk 'vector database management system'.