Přeskočit na obsah
TelegramWhatsApp

Slovník

Vector Database

Vektorová databáze je specializovaný typ databáze navržený pro ukládání, indexování a efektivní vyhledávání vysokodimenzionálních vektorů – numerických reprezentací dat vznikajících z AI modelů (embeddings). Zatímco tradiční databáze vyhledávají přesné shody nebo rozsahy hodnot, vektorové databáze najdou položky, které jsou sémanticky nejpodobnější zadanému dotazu.

Vyhledávání probíhá pomocí výpočtu vzdálenosti mezi vektory – nejčastěji kosinová podobnost nebo euklidovská vzdálenost. Dotaz se převede na vektor prostřednictvím embedding modelu a databáze vrátí N nejbližších sousedů (ANN – Approximate Nearest Neighbor search). Specializované indexovací algoritmy jako HNSW nebo IVF umožňují toto vyhledávání provádět v milisekundách i nad miliony záznamů.

Nejpoužívanější vektorové databáze jsou Pinecone (plně spravovaná cloudová služba), Weaviate a Qdrant (open-source s možností vlastního hostování) nebo pgvector (rozšíření PostgreSQL pro týmy, které nechtějí přidávat novou infrastrukturu). Každá má jiné kompromisy mezi latencí, škálovatelností a jednoduchostí správy.

V praxi jsou vektorové databáze klíčovou součástí RAG (Retrieval-Augmented Generation) architektur: firemní dokumenty, produktový katalog nebo znalostní báze se převedou na embeddings a uloží do vektorové databáze. Při dotazu uživatele systém vyhledá nejrelevantnější úryvky a předá je jazykovému modelu jako kontext, čímž výrazně snižuje halucinace a umožňuje modelu odpovídat z aktuálních, privátních dat.