Query Expansion
« Zurück zum Glossar IndexQuery Expansion bezeichnet die algorithmische Erweiterung einer Suchanfrage um zusätzliche Begriffe oder semantisch verwandte Varianten, um die Treffermenge zu verbessern. Ziel ist die Erhöhung des Recalls durch Abdeckung von Synonymen, Entitäten oder thematischen Varianten. Query Expansion ist eine etablierte Technik im Information Retrieval und in modernen RAG-Systemen.
Funktionsweise und Einordnung
Bei der Query Expansion wird die ursprüngliche Anfrage automatisch ergänzt.
Typische Erweiterungsstrategien:
- Synonym-Erweiterung
Ergänzung semantisch gleichbedeutender Begriffe. - Entitätsbasierte Erweiterung
Hinzufügen verwandter Entitäten oder Attribute. - Statistische Expansion
Nutzung ko-auftretender Begriffe aus Korpora. - Embedding-basierte Expansion
Generierung semantisch naher Begriffe im Vektorraum.
Beispiel:
Ursprungsanfrage:
„semantische Suche“
Erweiterte Anfrage:
„semantische Suche“, „bedeutungsbasierte Suche“, „Vektorsuche“, „Embeddings in Suchsystemen“
Die erweiterte Anfrage wird anschließend im Retrieval verwendet.
Query Expansion erhöht primär den Recall, kann jedoch bei unsauberer Erweiterung Präzision reduzieren.
Strategische Bedeutung für SEO und AI-Search
AI-Search-Systeme nutzen Query Expansion, um semantische Varianten abzudecken.
Implikationen für Generative Engine Optimization:
- Synonyme sollten natürlich im Text vorkommen.
- Zentrale Entitäten müssen explizit benannt sein.
- Themenrelevante Begriffe erhöhen Anschlussfähigkeit.
- Einseitige Terminologie reduziert Auffindbarkeit.
In embedding-basierten Systemen kann Query Expansion implizit über Vektornähe erfolgen.
Sichtbarkeit entsteht durch semantische Breite bei gleichzeitiger thematischer Klarheit.
Beispiel
Anfrage:
„Hybrid Search Erklärung“
Ein System erweitert zu:
- „Hybrid Retrieval“
- „BM25 und Vektorsuche kombinieren“
- „lexikalische und semantische Suche“
Dokumente, die eine dieser Varianten enthalten, werden eher retrievt.
Häufige Fragen zu Query Expansion
Warum wird Query Expansion eingesetzt?
Nutzer formulieren Anfragen oft unvollständig oder variierend. Query Expansion erhöht die Abdeckung semantischer Varianten. Dadurch steigt die Wahrscheinlichkeit relevanter Treffer.
Kann Query Expansion die Relevanz verschlechtern?
Ja, wenn irrelevante Begriffe ergänzt werden. Eine unsaubere Erweiterung kann Rauschen erzeugen. Systeme müssen daher Gewichtung und Kontrolle implementieren.
Ist Query Expansion nur für Sparse Retrieval relevant?
Nein, sie wird sowohl in lexikalischen als auch in embedding-basierten Systemen genutzt. In Dense Retrieval kann Expansion implizit über semantische Nähe erfolgen. Beide Ansätze profitieren von kontextsensitiver Erweiterung.
Welche Rolle spielt Query Expansion in RAG-Systemen?
RAG-Systeme nutzen Expansion zur Verbesserung des Retrieval-Recalls. Mehr relevante Kandidaten erhöhen die Chance hochwertiger Kontexte. Die finale Auswahl erfolgt meist durch Re-Ranking.
Verwandte Begriffe
Fan-Out Queries
Retriever
Dense Retrieval
Sparse Retrieval
Hybrid Search
Embeddings
Vektorsuche
Re-Ranking
Generative Engine Optimization