Entity Resolution
« Zurück zum Glossar IndexEntity Resolution bezeichnet den Prozess der Identifikation und Zusammenführung unterschiedlicher Datenreferenzen, die dieselbe reale Entität repräsentieren. Ziel ist die Eliminierung von Duplikaten und die Herstellung eindeutiger Identitäten über verschiedene Datenquellen hinweg. Entity Resolution ist eine zentrale Technik im Datenmanagement und Knowledge-Graph-Aufbau.
Funktionsweise und Einordnung
Entity Resolution wird eingesetzt, wenn identische Entitäten unter unterschiedlichen Bezeichnungen oder Attributkombinationen auftreten.
Typische Schritte:
- Standardisierung
Normalisierung von Schreibweisen, Formaten und Attributen. - Kandidatenbildung
Identifikation potenziell gleicher Entitäten. - Ähnlichkeitsbewertung
Vergleich von Attributen wie Name, Adresse, Kontext oder Identifikatoren. - Fusion oder Verknüpfung
Zusammenführung der Datensätze oder Verweis auf eine eindeutige ID.
Beispiel:
- „Ralf Dodler“
- „R. Dodler“
- „Dodler, Ralf“
Entity Resolution erkennt diese Einträge als dieselbe Person.
Im Unterschied zu Entity Linking geht es hier nicht um die Zuordnung zu einem externen Knowledge Graph, sondern um die interne Identitätskonsolidierung.
Strategische Bedeutung für SEO und AI-Search
Suchsysteme und Knowledge Graphen benötigen konsistente Entitäten.
Implikationen für Generative Engine Optimization:
- Konsistente Namensverwendung erhöht Entitätsstabilität.
- Strukturierte Daten unterstützen eindeutige Identifikation.
- Mehrfachvarianten sollten kontrolliert eingesetzt werden.
- Autoritätsaufbau erfordert eindeutige Entitätszuordnung.
Fehlende Entity Resolution kann zu fragmentierter Sichtbarkeit führen, da Systeme mehrere Identitäten statt einer konsolidierten Entität erkennen.
Sichtbarkeit entsteht durch Identitätskonsistenz.
Beispiel
Ein Unternehmen erscheint in verschiedenen Datenquellen als:
- „Example GmbH“
- „Example GmbH Berlin“
- „Example Ltd.“
Entity Resolution analysiert Attribute wie Adresse, Handelsregisternummer oder Website und führt die Einträge zu einer konsistenten Entität zusammen.
Häufige Fragen zu Entity Resolution
Was unterscheidet Entity Resolution von Entity Linking?
Entity Resolution konsolidiert mehrere Datensätze zu einer identischen Entität. Entity Linking ordnet eine Textentität einem bestehenden Knowledge-Graph-Eintrag zu. Resolution arbeitet intern, Linking referenziert extern.
Warum ist Entity Resolution für Knowledge Graphen wichtig?
Knowledge Graphen benötigen eindeutige Entitäten mit stabilen IDs. Ohne Resolution entstehen doppelte oder fragmentierte Knoten. Das reduziert semantische Klarheit.
Welche Daten werden bei Entity Resolution verglichen?
Typisch sind Namen, Attribute, Identifikatoren, Kontextinformationen oder strukturierte Metadaten. Auch semantische Ähnlichkeitsverfahren können eingesetzt werden. Die Auswahl hängt vom Datentyp ab.
Welche Risiken bestehen bei Entity Resolution?
Falsche Zusammenführungen können unterschiedliche Entitäten vermischen. Zu strenge Kriterien führen zu Duplikaten. Balance zwischen Präzision und Recall ist entscheidend.
Verwandte Begriffe
Entity Linking
Knowledge Graph
Entität
Named Entity Recognition
Disambiguierung
Structured Data
Data Cleansing
Information Retrieval
Generative Engine Optimization