Auf der Seite Ergebnisse analysieren werden die generierte verschachtelte, boolesche Vergleichsregel und potenzielle Vergleichsschlüsselkomponenten angezeigt, die aus den von Ihnen bereitgestellten Informationen ermittelt werden. Die Vergleichsregel kann überprüft und in die Vergleichsregel-Datenbank der Option Vergleichsregelverwaltung im Enterprise Designer exportiert werden. Dies kann in Stapelaufträgen weiter verarbeitet werden. Die potenziellen Vergleichsschlüsselkomponenten können nach der Überprüfung im Schritt Match Key Generator des Enterprise Designers verwendet werden.
Registerkarte „Vergleichsregel“
Auf dieser Registerkarte werden die Vergleichsregel und die damit verbundenen Bedingungen mit Attributen wie Schwellenwert, Bewertungsmethode, Algorithmen, Fehlende Daten und Übereinstimmungsmethode sowie die Werte für jedes dieser Attribute angezeigt.
Sie bietet außerdem die Möglichkeit zum Auswählen eines Vergleichsschlüssels aus der Dropdown-Liste
Verknüpfter Vergleichsschlüssel, den Sie mit der Vergleichsregel verknüpfen müssen. Sie können einen im Repository verfügbaren Vergleichsschlüssel oder einen der vom System vorgeschlagenen Vergleichsschlüssel auswählen. Wenn Sie einen vom System vorgeschlagenen Vergleichsschlüssel auswählen, müssen Sie sicherstellen, dass Sie ihm zum Zeitpunkt der Veröffentlichung einen Namen geben, da die vom System vorgeschlagenen Standardnamen Vergleichsschlüssel 1, Vergleichsschlüssel 2 usw. lauten.
Anmerkung: Sie können die Verknüpfung des Vergleichsschlüssels jederzeit aufheben, indem Sie den Vergleichsschlüssel löschen. Es ist zwingend erforderlich, die Regel erneut zu veröffentlichen, um die Änderungen zu berücksichtigen.
Sie können auch eine Vorschau des Vergleichsschlüssels anzeigen, indem Sie auf die Schaltfläche Vorschau des Vergleichsschlüssels klicken. Wenn Sie darauf klicken, wird ein neues Fenster geöffnet, in dem Sie den im Repository verfügbaren Vergleichsschlüssel nach Ihren Bedürfnissen weiter ändern oder den vom System vorgeschlagenen Vergleichsschlüssel verwenden können.
Anmerkung: Spectrum Smart Data Quality (SDQ) ist in Data Stewardship integriert, sodass Sie die Vergleichsregeln basierend auf der in Data Stewardship durchgeführten Ausnahmeverarbeitung verbessern können. Wenn Sie die manuellen Aktualisierungen der Datensätze in Data Stewardship speichern, wird dies als Benachrichtigung auf der Seite Projekte in SDQ angezeigt, die dem Projekt entspricht, an dem Sie Änderungen vorgenommen haben.
Anmerkung: Schließlich enthält die Seite „Datenqualität“ in Data Stewardship Informationen zu Trends bei Datenflüssen und Schritten.
Registerkarte „Vergleichsschlüssel“
Diese Registerkarte zeigt potenzielle Vergleichsschlüsselkomponenten in Tabellenform an. Außerdem wird die
Spalte angezeigt, in der die Vergleichsschlüsselkomponente zusammen mit dem zu verwendenden
Algorithmus gefunden wurde. Die
Durchschnittliche Gruppengröße hilft Ihnen, die durchschnittliche Größe der Gruppe für Ihren Vergleichsschlüssel zu bestimmen, der für den vollständigen Datensatz generiert wird. Sie erhalten den Durchschnitt jedes Werts basierend auf jeder Vergleichsschlüsselkombination, um Genauigkeitsverluste zu vermeiden. Sie können alle potenziellen Vergleichsschlüsselkomponenten basierend auf Ihrem Szenario überprüfen und verwenden, indem Sie diese im Schritt
Match Key Generator von
Enterprise Designer hinzufügen.
Anmerkung: Ab sofort werden die folgenden Algorithmen unterstützt.
Algorithmus |
Beschreibung |
Soundex |
Gibt einen Soundex-Code ausgewählter Felder zurück. Soundex erzeugt einen auf der englischen Aussprache eines Wortes basierenden Code mit fester Länge. |
Metaphone |
Gibt einen per Metaphone codierten Schlüssel ausgewählter Felder zurück. Metaphone ist ein Algorithmus, um Wörter anhand ihrer englischen Aussprache zu codieren. |
Consonant |
Gibt die angegebenen Felder mit entfernten Konsonanten zurück. |
Teilzeichenfolge |
Gibt einen angegebenen Teil des ausgewählten Feldes zurück. |
NYSIIS |
Phonetischer Codealgorithmus, der eine ungefähr übereinstimmende Aussprache mit der exakten Schreibweise vergleicht und Wörter indiziert, deren Aussprache ähnlich ist. Bestandteil des New York State Identification and Intelligence System. Angenommen, Sie suchen die Daten einer Person in einer Personendatenbank. Sie meinen, dass der Name der Person wie „John Smith“ klingt, er wird aber „Jon Smyth“ geschrieben. Würden Sie eine Suche durchführen, in der nach einer genauen Übereinstimmung mit „John Smith“ gesucht wird, würden keine Ergebnisse zurückgegeben. Wenn Sie jedoch die Datenbank mit dem Algorithmus NYSIIS indizieren und eine erneute Suche mit dem Algorithmus NYSIIS durchführen, wird die richtige Übereinstimmung zurückgegeben, weil vom Algorithmus sowohl „John Smith“ als auch „Jon Smyth“ als „JAN SNATH“ indiziert werden.
|
Double Metaphone |
Gibt einen auf einer phonetischen Darstellung ihrer Zeichen basierenden Code zurück. „Double Metaphone“ ist eine verbesserte Version des Algorithmus „Metaphone“ und versucht, viele der in unterschiedlichen Sprachen vorkommenden Unregelmäßigkeiten zu berücksichtigen. |
MD5 |
Ein Message Digest-Algorithmus, der einen 128-Bit-Hashwert erzeugt. Dieser Algorithmus wird im Allgemeinen verwendet, um die Datenintegrität zu überprüfen. |
Beispiel: Diese Relation enthält einen potenziellen Vergleichsschlüssel: der
Vergleichsschlüssel 1, der in der Spalte
Telefon gefunden wurde und eine durchschnittliche Gruppengröße von 2 aufweist. Der zu verwendende Algorithmus ist
SUBSTRING (1, 7), wobei
1 der Startindex und
7 der letzte in den Optionen des Schrittes
Match Key Generator zu spezifizierende Index ist. Der Startindex ist für alle potenziellen Vergleichsschlüsselkomponenten auf
1 festgelegt.
Vergleichsschlüssel |
Spalte |
Algorithmus |
Durchschnittliche Gruppengröße |
Vergleichsschlüssel 1 |
Telefon |
SUBSTRING (1, 7) |
2 |
Basierend auf den von Ihnen ausgeführten Aktionen In den hochgeladenen Beispieldaten enthaltene Variationen, Für Vergleich ausgewählte Spalten und Gekennzeichnete Datensätze hat das System in Ihren Daten vorhandene Muster entsperrt, um Ihnen eine Vergleichsregel und mögliche Vergleichsschlüsselkomponenten zur Verfügung zu stellen. Es wird empfohlen, die generierten Ergebnisse für Ihr Dataset zu testen.