IDEAL-X
← KI-Glossar

KI-Glossar

Vektor-Datenbanken

Die Bibliothek für Bedeutungen — das Herzstück moderner KI-Systeme.

Eine Vektor-Datenbank ist eine spezialisierte Datenbank, die Embeddings speichert und nach Ähnlichkeit statt nach exakten Übereinstimmungen sucht. Klassische Datenbanken suchen nach dem Muster „Name = Müller”; Vektor-Datenbanken vergleichen semantische Konzepte.

Kernmerkmale:

  • Schnell: Ähnlichkeitssuche in Millisekunden über Millionen Einträge
  • Skalierbar: Von Tausenden bis Milliarden Vektoren ohne Performanceverlust
  • Flexibel: Speichert Text, Bilder, Audio — alles in Vektorform

Vektor-Datenbank vs. klassische Datenbank

AspektKlassische DBVektor-Datenbank
Sucht nachExakten WertenÄhnlichkeit/Nähe
DatenformatTabellen, Zeilen, SpaltenHochdimensionale Vektoren
StärkeTransaktionen, ReportsSemantische Suche, RAG, KI
BeispielePostgreSQL, MySQL, SAP HANAWeaviate, Pinecone, Qdrant

Wie eine Vektor-Datenbank funktioniert

  1. Vektoren einpflegen: Dokumente werden durch Embedding-Modelle in Vektoren konvertiert, zusammen mit Originaltext und Metadaten gespeichert.
  2. Index aufbauen: Effiziente Indizes (z. B. HNSW) organisieren Vektoren für millisekundenschnelle Ähnlichkeitssuche.
  3. Anfrage verarbeiten: Nutzeranfrage wird vektorisiert; System findet die k semantisch ähnlichsten Einträge.
  4. Ergebnisse zurückgeben: Originaltexte der ähnlichsten Vektoren werden an das LLM als Kontext übergeben.

Die wichtigsten Vektor-Datenbanken

Weaviate — Open Source, native Hybrid Search, GraphQL-API. Ideal für produktive RAG-Systeme, DSGVO-konform selbst hostbar. Empfehlung für den Mittelstand.

Qdrant — Open Source, in Rust geschrieben — sehr performant. Einfache API, gut für schnellen Start. Hohe Performance.

Pinecone — Managed Cloud-Service, kein eigenes Hosting nötig. Schneller Einstieg, Daten auf US-Servern. Einfachster Start.

Häufige Fragen

Kann ich PostgreSQL als Vektor-Datenbank nutzen? Ja — PostgreSQL mit pgvector-Erweiterung unterstützt Vektoren. Gut für kleine bis mittlere Anwendungen; spezialisierte Datenbanken sind produktiv performanter.

Wie viel Speicherplatz braucht eine Vektor-Datenbank? Ein Vektor mit 1.536 Dimensionen (OpenAI ada-002) benötigt ca. 6 KB. 100.000 Dokumente erfordern ungefähr 600 MB für Vektoren plus Index und Originaltext.

Was ist der Unterschied zwischen Vektor-Datenbank und Graph-Datenbank? Vektor-Datenbanken speichern Embeddings und suchen semantische Ähnlichkeit. Graph-Datenbanken (z. B. Neo4j) speichern Entitäten und Beziehungen. GraphRAG kombiniert beide.

Sind Vektor-Datenbanken DSGVO-konform? Die Technologie selbst ist neutral. Konformität hängt vom Hosting-Ort und den gespeicherten Daten ab. Open-Source-Lösungen (Weaviate, Qdrant) können auf EU-Infrastruktur betrieben werden.

Verwandte Begriffe

KI konkret für Ihr Unternehmen einordnen

Wir besprechen Ihre Ausgangslage und zeigen, wo KI in Ihrem Kontext realistische Wirkung entfaltet.

Kostenloses Erstgespräch