Bei diesem Schritt wird ein nicht eindeutiger Schlüssel erstellt, den alle ähnlichen Datensätze aufweisen. Sie haben die Möglichkeit, Datensätze mit demselben Vergleichsschlüssel zu gruppieren.
Match Key Generator erstellt einen nicht eindeutigen Schlüssel für jeden Datensatz, der dann von Vergleichsschritten verwendet werden kann, um Gruppen potenzieller Datensatzdubletten zu identifizieren. Vergleichsschlüssel erleichtern den Vergleichsprozess, da sie Ihnen erlauben, Datensätze nach Vergleichsschlüssel zu gruppieren und dann nur Datensätze innerhalb dieser Gruppen zu vergleichen.
Der Vergleichsschlüssel wird mithilfe von Regeln erstellt, die Sie definieren, und besteht aus Eingabefeldern. Jedes angegebene Eingabefeld verfügt über einen ausgewählten Algorithmus, der dafür ausgeführt wird. Das Ergebnis eines jeden Algorithmus wird dann verkettet, um ein einzelnes Vergleichsschlüsselfeld zu erstellen.
Zusätzlich zum Erstellen von Vergleichsschlüsseln können Sie auch Schnellvergleichsschlüssel erstellen, die später im Datenfluss durch einen „Intraflow Match“- oder „Interflow Match“-Schritt verwendet werden.
Sie können mehrere Vergleichsschlüssel und Schnellvergleichsschlüssel erstellen.
Beispiel: Wenn der eingehende Datensatz wie folgt lautet:
Vorname: Fred
Nachname: Mertz
Postleitzahl: 21114-1687
Geschlechtscode: M
Und Sie eine Vergleichsschlüsselregel definieren, die einen Vergleichsschlüssel generiert, indem Daten aus dem Datensatz wie folgt kombiniert werden:
Eingabefeld | Startposition | Länge |
---|---|---|
Postleitzahl | 1 | 5 |
Postleitzahl | 7 | 4 |
Nachname | 1 | 5 |
Vorname | 1 | 5 |
Geschlechtscode | 1 | 1 |
Dann ergäbe sich der Schlüssel:
211141687MertzFredM