Spectrum Advanced Matching - spectrum_quality_1 - 23 - 23.1

Spectrum Data Quality-Handbuch

Product type
Software
Portfolio
Verify
Product family
Spectrum
Product
Spectrum > Qualität > Spectrum Quality
Version
23.1
Language
Deutsch
Product name
Spectrum Data Quality
Title
Spectrum Data Quality-Handbuch
First publish date
2007
Last updated
2023-10-25
Published on
2023-10-25T06:24:19.942092

Spectrum Advanced Matching vergleicht Datensätze zwischen und innerhalb einer beliebigen Anzahl von Eingabedateien. Mithilfe von Spectrum Advanced Matching können Sie Vergleiche auf vielen verschiedenen Feldern durchführen, einschließlich „Name“ und „Adresse“. Selbiges gilt für Felder, die nicht der Angabe von Namen oder Adressen dienen, z. B. für die Sozialversicherungsnummer oder das Geburtsdatum.

Komponenten

Spectrum Advanced Matching wird im Rahmen der folgenden Schritte im Enterprise Designer implementiert:

  • Best of Breed: Bei diesem Schritt wird ein „Best of Breed“-Datensatz aus dem Dubletten-Cluster ausgewählt, indem ein Vorlagendatensatz ausgewählt wird. Anschließend wird mithilfe dieses Datensatzes ein zusammengesetzter Datensatz erstellt, der zum Survivor-Datensatz wird.
  • Candidate Finder: Mit diesem Schritt werden die Kandidatendatensätze gefunden, welche die Gruppe potenzieller Übereinstimmungen bilden werden, die während des „Transactional Match“-Schrittes ausgewertet wird. Candidate Finder wird mit „Transactional Match“ verwendet.
  • Duplicate Synchronization: Mithilfe dieses Schritts können Sie bestimmen, welche Felder aus einer Sammlung von Datensätzen in die entsprechenden Felder aller Datensätze in der Sammlung kopiert (veröffentlicht) werden.
  • Filter: Über diesen Schritt können Sie die Kriterien festlegen, die Datensätze erfüllen müssen, um in einer Sammlung von Datensatzdubletten beibehalten oder daraus entfernt zu werden, entweder zur weiteren Downstream-Verarbeitung oder für Ihre Ausgabedatei.
  • Gruppenschlüssel-Generator: In diesem Schritt wird eine Gruppenstrategie verwendet, um Gruppenschlüssel zu erstellen und ausgewählte Felder transitiv zusammenzuführen.
  • Interflow Match: Anhand dieses Schrittes werden Übereinstimmungen zwischen ähnlichen Datensätzen unter mehreren Eingabestreams ermittelt.
  • Intraflow Match: Anhand dieses Schrittes werden Übereinstimmungen zwischen ähnlichen Datensätzen innerhalb eines einzelnen Eingabestreams ermittelt.
  • Match Key Generator: Bei diesem Schritt wird ein nicht eindeutiger Schlüssel erstellt, den alle ähnlichen Datensätze aufweisen. Sie haben die Möglichkeit, Datensätze mit demselben Vergleichsschlüssel zu gruppieren.
  • Transactional Match: Bei diesem Schritt werden Kopfdublettentransaktionen über den „Candidate Finder“-Schritt mit einer Datenbank abgeglichen, um potenzielle Kandidatendatensätze abzufragen und zurückzugeben.
  • Write to Search Index: Mithilfe dieses Schrittes können Sie einen Volltextindex basierend auf den für die Verarbeitung im Schritt akzeptierten Daten erstellen. Sie können Daten in einem dedizierten Suchindex aufbewahren, um die Antwortzeiten beim Durchsuchen von Candidate Finder zu verbessern.