Erstellen eines Vergleichsschlüssels - discovery - 23 - 23.1

Spectrum Discovery-Handbuch

Product type
Software
Portfolio
Verify
Product family
Spectrum
Product
Spectrum > Discovery
Version
23.1
Language
Deutsch
Product name
Spectrum Discovery
Title
Spectrum Discovery-Handbuch
First publish date
2007
Last updated
2023-10-25
Published on
2023-10-25T06:23:10.810287

Ein Vergleichsschlüssel ist ein nicht eindeutiger Schlüssel, der von ähnlichen Datensätzen geteilt wird, die Datensätze als potenzielle Dubletten identifizieren. Der Vergleichsschlüssel vereinfacht den Vergleichsprozess, indem nur die Datensätze miteinander verglichen werden, die den gleichen Vergleichsschlüssel enthalten. Mit dem Feature Vergleichsschlüssel können Sie:

  • Einen Vergleichsschlüssel veröffentlichen: Veröffentlichen Sie einen Vergleichsschlüssel zur Wiederverwendung zu einem späteren Zeitpunkt im Repository.
  • Eine Vorschau eines Vergleichsschlüssels anzeigen: Sie können den Vergleichsschlüssel mit den Eingabedaten und dem Ergebnis unten auf der Seite in einer Vorschau anzeigen, um mögliche Fehler zu vermeiden.

Beispiel

Sehen Sie sich die folgende Eingabe an:
  • Vorname – Fred
  • Nachname – Mertz
  • Geschlechtscode – M
    Wenn Sie mit der obigen Eingabe eine Vergleichsschlüsselregel definieren müssen, die einen Vergleichsschlüssel durch Kombinieren von Daten aus dem unten gezeigten Datensatz generiert, lautet der Vergleichsschlüssel „MertzFredM“.
    Eingabefeld Startposition Länge
    Nachname 1 5
    Vorname 1 5
    Geschlechtscode 1 1
Führen Sie die folgenden Schritte aus, um einen Vergleichsschlüssel zu erstellen:
  1. Klicken Sie auf der Seite Quellendetails auf die Schaltfläche Vergleichsschlüssel erstellen.
    Die Seite Vergleichsschlüssel wird angezeigt.
  2. Geben Sie auf der Seite Vergleichsschlüssel einen eindeutigen Namen für Ihren Vergleichsschlüssel in das Feld Vergleichsschlüsselname ein.
  3. Wählen Sie Hinzufügen aus, um die Regel für Ihren Vergleichsschlüssel zu definieren.
    Rechts auf der Seite sehen Sie den Bereich Regeloptionen.
  4. Konfigurieren Sie im Bereich Regeloptionen die folgenden Optionen:
    Option Beschreibung
    Algorithmus
    Consonant
    Gibt die angegebenen Felder mit entfernten Konsonanten zurück.
    Double Metaphone
    Diese Option gibt einen auf einer phonetischen Darstellung ihrer Zeichen basierenden Code zurück. „Double Metaphone“ ist eine verbesserte Version des Algorithmus „Metaphone“ und versucht, viele der in unterschiedlichen Sprachen vorkommenden Unregelmäßigkeiten zu berücksichtigen.
    Köln
    Indiziert Namen nach Klang, so wie sie auf Deutsch ausgesprochen werden. Ermöglicht die Codierung von Namen mit derselben Aussprache in derselben Darstellung zu „Köln“, sodass sie trotz kleiner Unterschiede bei der Schreibweise verglichen werden können. Das Ergebnis ist immer eine Folge von Zahlen; Sonderzeichen und Leerzeichen werden ignoriert. Diese Option wurde entwickelt, um auf die Einschränkungen von Soundex zu reagieren.
    MD5
    Es handelt sich um einen Message-Digest-Algorithmus, der einen 128-Bit-Hashwert erzeugt, der zur Überprüfung der Datenintegrität verwendet wird.
    Metaphone
    Gibt einen per Metaphone codierten Schlüssel ausgewählter Felder zurück. Metaphone ist ein Algorithmus, um Wörter anhand ihrer englischen Aussprache zu codieren.
    Metaphone (Spanisch)
    Diese Option gibt einen per Metaphone codierten Schlüssel ausgewählter Felder für die spanische Sprache zurück. Dieser Metaphone-Algorithmus codiert Wörter anhand ihrer spanischen Aussprache.
    Metaphone3
    Diese Option übertrifft die Algorithmen „Metaphone“ und „Double Metaphone“ mit genaueren Metaphone3-Einstellungen für Konsonanten und innere Vokale, was Ihnen ermöglicht, Wörter oder Namen auf phonetischer Basis mehr oder weniger eng mit Suchbegriffen abgeglichen zu erzeugen. Metaphone3 erhöht die Genauigkeit der phonetischen Codierung auf 98 %. Diese Option wurde entwickelt, um auf die Einschränkungen von Soundex zu reagieren.
    NYSIIS
    Phonetischer Codealgorithmus, der eine ungefähr übereinstimmende Aussprache mit der exakten Schreibweise vergleicht und Wörter indiziert, deren Aussprache in NYSIIS ähnlich ist. Bestandteil des New York State Identification and Intelligence System. Angenommen, Sie suchen die Daten einer Person in einer Personendatenbank. Sie meinen, dass der Name der Person wie „John Smith“ klingt, er wird aber „Jon Smyth“ geschrieben. Würden Sie eine Suche durchführen, in der nach einer genauen Übereinstimmung mit „John Smith“ gesucht wird, würden keine Ergebnisse zurückgegeben werden. Wenn Sie jedoch die Datenbank mit dem Algorithmus NYSIIS indizieren und eine erneute Suche mit dem Algorithmus NYSIIS durchführen, wird die richtige Übereinstimmung zurückgegeben, weil vom Algorithmus sowohl „John Smith“ als auch „Jon Smyth“ als „JAN SNATH“ indiziert werden.
    Phonix
    Bei dieser Option werden Namenszeichenfolgen vorverarbeitet, indem mehr als 100 Transformationsregeln auf einzelne Zeichen oder Zeichenfolgen angewendet werden. 19 dieser Regeln werden nur angewendet, wenn das bzw. die Zeichen am Anfang der Zeichenfolge stehen, während 12 der Regeln angewendet werden, wenn sie in der Mitte der Zeichenfolge stehen. 28 der Regeln werden angewendet, wenn sie am Ende der Zeichenfolge stehen. Die transformierte Namenszeichenfolge wird als Code codiert, der aus einem Anfangsbuchstaben gefolgt von drei Stellen besteht (Nullen und doppelt vorhandene Zahlen werden entfernt). Diese Option wurde entwickelt, um auf Einschränkungen von Soundex zu reagieren. Sie ist komplexer und deshalb langsamer als Soundex.
    Sonnex
    Dieser Algorithmus bestimmt die Ähnlichkeit zwischen zwei französischen Zeichenfolgen auf Grundlage der phonetischen Darstellung ihrer Zeichen. Es wird ein Sonnex-codierter Schlüssel der ausgewählten Felder zurückgegeben.
    Soundex
    Gibt einen Soundex-Code ausgewählter Felder zurück. Soundex erzeugt einen auf der englischen Aussprache eines Wortes basierenden Code mit fester Länge.
    Teilzeichenfolge
    Gibt einen angegebenen Teil des ausgewählten Feldes zurück.
    Feldname Wählen Sie das Feld aus, auf das Sie den ausgewählten Algorithmus anwenden möchten. Wenn Sie beispielsweise LastName auswählen und den SubString-Algorithmus wählen, wird der SubString-Algorithmus auf die Daten im Feld „LastName“ angewendet, um einen Vergleichsschlüssel zu erzeugen.
    Startposition Wählen Sie die Startposition innerhalb des angegebenen Feldes aus.
    Anmerkung: Sie können nur dann eine Startposition auswählen, wenn Sie den SubString-Algorithmus auswählen.
    Länge Wählen Sie die Länge der Zeichen aus, die Sie ab der Startposition einschließen möchten.
    Anmerkung: Sie können nur dann eine Länge auswählen, wenn Sie den SubString-Algorithmus auswählen.
    Vorverarbeitungsoptionen
    Sonderzeichen entfernen
    Diese Option entfernt alle nicht numerischen und nicht alphabetischen Zeichen wie Bindestriche, Leerzeichen und andere Sonderzeichen aus einem Eingabefeld.
    Eingabe sortieren
    Sortiert alle Zeichen oder Begriffe in einem Eingabefeld in alphabetischer Reihenfolge.
    • Zeichen: Sortiert die Zeichenwerte aus einem Eingabefeld vor dem Erstellen einer eindeutigen ID.
    • Begriffe: Sortiert jeden Begriffswert aus einem Eingabefeld vor dem Erstellen einer eindeutigen ID.
    Anmerkung: Sie können die Sortiereingabe nur dann auswählen, wenn Sie den Consonant- oder SubString-Algorithmus auswählen.
  5. Wählen Sie OK aus.
    Sie können den Vergleichsschlüssel jetzt speichern oder veröffentlichen. Weitere Informationen finden Sie unter Speichern und Veröffentlichen des Vergleichsschlüssels.