Vektorsuche
« Zurück zum Glossar IndexVektorsuche bezeichnet ein Suchverfahren, bei dem Anfragen und Dokumente als numerische Vektoren repräsentiert und über Ähnlichkeitsmetriken im Vektorraum verglichen werden. Ziel ist die Identifikation semantisch ähnlicher Inhalte unabhängig von exakter Wortübereinstimmung. Vektorsuche ist eine Kerntechnologie moderner semantischer Such- und RAG-Systeme.
Funktionsweise und Einordnung
Bei der Vektorsuche werden Inhalte mithilfe eines Embedding-Modells in hochdimensionale Vektoren transformiert.
Der Ablauf:
- Transformation der Suchanfrage in einen Anfragevektor
- Vergleich mit gespeicherten Dokument- oder Chunk-Vektoren
- Berechnung einer Distanzmetrik (z. B. Kosinus-Ähnlichkeit)
- Rückgabe der semantisch nächsten Treffer
Im Unterschied zur lexikalischen Suche (z. B. BM25) basiert die Relevanz nicht auf Term-Frequenzen, sondern auf Bedeutungsnähe im Vektorraum.
Technisch wird häufig eine Approximate-Nearest-Neighbor-Suche (ANN) verwendet, um Skalierbarkeit bei Millionen oder Milliarden Vektoren zu gewährleisten.
Vektorsuche ist besonders relevant für:
- semantische Suche
- Retrieval-Augmented Generation
- Empfehlungssysteme
- Frage-Antwort-Systeme
Strategische Bedeutung für SEO und AI-Search
AI-Search-Systeme nutzen Vektorsuche als primären Retrieval-Mechanismus.
Implikationen für Generative Engine Optimization:
- Inhalte müssen semantisch kohärent sein.
- Eindeutige Entitätsdefinitionen stabilisieren Embeddings.
- Klare Abschnittsstruktur verbessert Chunk-Qualität.
- Synonymvielfalt erhöht semantische Anschlussfähigkeit.
In embedding-basierten Architekturen konkurrieren Inhalte nicht um Keyword-Dichte, sondern um semantische Nähe.
Sichtbarkeit entsteht im Bedeutungsraum.
Beispiel
Anfrage:
„Wie funktioniert bedeutungsbasierte Suche?“
Auch wenn das Dokument den Begriff „semantische Suche“ verwendet, kann die Vektorsuche es als relevant identifizieren, da beide Begriffe im Vektorraum nahe beieinander liegen.
Die Ähnlichkeit entsteht durch Bedeutungsnähe, nicht durch identische Wortwahl.
Häufige Fragen zu Vektorsuche
Was unterscheidet Vektorsuche von klassischer Keyword-Suche?
Keyword-Suche basiert auf exakten oder statistischen Wortübereinstimmungen. Vektorsuche vergleicht Bedeutungsrepräsentationen im Vektorraum. Sie erkennt semantische Ähnlichkeit auch bei unterschiedlichen Formulierungen.
Welche Rolle spielen Embeddings in der Vektorsuche?
Embeddings sind die Grundlage der Vektorsuche. Sie übersetzen Texte in numerische Repräsentationen. Ohne Embeddings kann keine semantische Distanz berechnet werden.
Warum wird Approximate Nearest Neighbor verwendet?
Exakte Nearest-Neighbor-Suche ist bei großen Datenmengen zu langsam. ANN-Verfahren liefern nahezu identische Ergebnisse bei deutlich höherer Geschwindigkeit. Sie ermöglichen Skalierbarkeit.
Ist Vektorsuche immer besser als Keyword-Suche?
Vektorsuche ist überlegen bei Bedeutungsabgleich und offenen Fragen. Keyword-Suche kann bei präzisen technischen Begriffen effizienter sein. Moderne Systeme kombinieren beide Ansätze.
Verwandte Begriffe
Embeddings
Vektordatenbank
Semantische Suche
Information Retrieval
Retrieval-Augmented Generation
Chunking
Approximate Nearest Neighbor
Large Language Model
Generative Engine Optimization