Spectrum Advanced Matching vergleicht Datensätze zwischen und innerhalb einer beliebigen Anzahl von Eingabedateien. Mithilfe von Spectrum Advanced Matching können Sie Vergleiche auf vielen verschiedenen Feldern durchführen, einschließlich „Name“ und „Adresse“. Selbiges gilt für Felder, die nicht der Angabe von Namen oder Adressen dienen, z. B. für die Sozialversicherungsnummer oder das Geburtsdatum.
Komponenten
Spectrum Advanced Matching wird im Rahmen der folgenden Schritte im Enterprise Designer implementiert:
- Best of Breed: Bei diesem Schritt wird ein „Best of Breed“-Datensatz aus dem Dubletten-Cluster ausgewählt, indem ein Vorlagendatensatz ausgewählt wird. Anschließend wird mithilfe dieses Datensatzes ein zusammengesetzter Datensatz erstellt, der zum Survivor-Datensatz wird.
- Candidate Finder: Mit diesem Schritt werden die Kandidatendatensätze gefunden, welche die Gruppe potenzieller Übereinstimmungen bilden werden, die während des „Transactional Match“-Schrittes ausgewertet wird. Candidate Finder wird mit „Transactional Match“ verwendet.
- Duplicate Synchronization: Mithilfe dieses Schritts können Sie bestimmen, welche Felder aus einer Sammlung von Datensätzen in die entsprechenden Felder aller Datensätze in der Sammlung kopiert (veröffentlicht) werden.
- Filter: Über diesen Schritt können Sie die Kriterien festlegen, die Datensätze erfüllen müssen, um in einer Sammlung von Datensatzdubletten beibehalten oder daraus entfernt zu werden, entweder zur weiteren Downstream-Verarbeitung oder für Ihre Ausgabedatei.
- Gruppenschlüssel-Generator: In diesem Schritt wird eine Gruppenstrategie verwendet, um Gruppenschlüssel zu erstellen und ausgewählte Felder transitiv zusammenzuführen.
- Interflow Match: Anhand dieses Schrittes werden Übereinstimmungen zwischen ähnlichen Datensätzen unter mehreren Eingabestreams ermittelt.
- Intraflow Match: Anhand dieses Schrittes werden Übereinstimmungen zwischen ähnlichen Datensätzen innerhalb eines einzelnen Eingabestreams ermittelt.
- Match Key Generator: Bei diesem Schritt wird ein nicht eindeutiger Schlüssel erstellt, den alle ähnlichen Datensätze aufweisen. Sie haben die Möglichkeit, Datensätze mit demselben Vergleichsschlüssel zu gruppieren.
- Transactional Match: Bei diesem Schritt werden Kopfdublettentransaktionen über den „Candidate Finder“-Schritt mit einer Datenbank abgeglichen, um potenzielle Kandidatendatensätze abzufragen und zurückzugeben.
- Write to Search Index: Mithilfe dieses Schrittes können Sie einen Volltextindex basierend auf den für die Verarbeitung im Schritt akzeptierten Daten erstellen. Sie können Daten in einem dedizierten Suchindex aufbewahren, um die Antwortzeiten beim Durchsuchen von Candidate Finder zu verbessern.