Beispiel: Verwenden von Match Analysis - spectrum_quality_1 - 23 - 23.1

Spectrum Data Quality-Handbuch

Product type
Software
Portfolio
Verify
Product family
Spectrum
Product
Spectrum > Qualität > Spectrum Quality
Version
23.1
Language
Deutsch
Product name
Spectrum Data Quality
Title
Spectrum Data Quality-Handbuch
First publish date
2007
Last updated
2023-10-25
Published on
2023-10-25T06:24:19.942092

Dieses Beispiel zeigt, wie das „Match Analysis“-Tool verwendet wird, um die An- und Abstiegsraten von zwei unterschiedlichen Übereinstimmungen zu vergleichen. Bevor die Daten an das Vergleichstool gesendet werden, werden sie mithilfe eines Broadcasters in zwei Streams aufgeteilt. Jeder Stream wird anschließend durch einen „Intraflow Match“-Schritt geschickt. Jeder Datenstream enthält identische Kopien der verarbeiteten Daten. Jeder „Intraflow Match“-Schritt verwendet einen anderen Vergleichsalgorithmus und generiert „Match Analysis“-Daten, die Sie zum Vergleich des An-/Abstiegs von verschiedenen Übereinstimmungen nutzen können.

Datenfluss für die Vergleichsanalyse

Dieser Beispieldatenfluss steht im Enterprise Designer zur Verfügung. Öffnen Sie Datei > Neu > Datenfluss > Aus Vorlage, und wählen Sie HouseholdRelationshipsAnalysis aus. Dieser Datenfluss erfordert die folgenden Produkte: Advanced Matching, Data Normalization und Universal Name. Er erfordert außerdem das Laden der „Table Lookup“-Kerndatenbank und der „Open Parser“-Basistabellen.

Schauen Sie sich zur korrekten Anwendung das Beispiel an:

  1. Führen Sie den Datenfluss aus.
  2. Wählen Sie Tools > Match Analysis aus.
  3. Erweitern Sie im Fenster Vergleichsergebnisse durchsuchen das Element HouseholdRelationshipAnalysis, und wählen Sie Household Match 1 und Household Match 2 aus der Liste „Quelle“ aus. Klicken Sie anschließend auf Hinzufügen.
  4. Wählen Sie aus der Liste der Vergleichsergebnisse den Eintrag Household Match 1 aus, und klicken Sie auf Vergleichen. Dadurch werden Ergebnisse auf der Registerkarte Zusammenfassung angezeigt.
  5. Klicken Sie auf die Registerkarte An-/Abstieg. Das Diagramm „An-/Abstieg“ wird angezeigt.
    Diagramm „An-/Abstieg“ in der Vergleichsanalyse

    Dieses Diagramm zeigt die Unterschiede zwischen Dubletten- und eindeutigen Datensätzen, die für die unterschiedlichen verwendeten Vergleichsregeln erstellt wurden.

  6. Klicken Sie auf die Registerkarte Vergleichsregeln. Dadurch wird der Vergleich der Vergleichsregeln angezeigt.

    Vergleich der Vergleichsregeln auf der Registerkarte „Vergleichsregeln“

    Auf dieser Registerkarte sehen Sie, dass der Algorithmus geändert wurde. Die Zeichenhäufigkeit wurde ausgelassen und „Genaue Übereinstimmung“ wurde hinzugefügt.

  7. Klicken Sie auf Details.
  8. Wählen Sie Dublettensammlungen aus der Anzeigeliste aus, und klicken Sie auf Aktualisieren.
  9. Erweitern Sie jedes CollectionNumber, um die Kopfdubletten- und Dublettendatensätze für jede Dublettensammlung anzuzeigen.
    Sammlungsnummern erweitert
  10. Vergleichen Sie die Sammlungen in der Ansicht „Detail“ mit der erstellen Ausgabedatei.