Standardisieren von Personennamen - spectrum_quality_1 - 23 - 23.1

Spectrum Data Quality-Handbuch

Product type
Software
Portfolio
Verify
Product family
Spectrum
Product
Spectrum > Qualität > Spectrum Quality
Version
23.1
Language
Deutsch
Product name
Spectrum Data Quality
Title
Spectrum Data Quality-Handbuch
First publish date
2007
Last updated
2023-10-25
Published on
2023-10-25T06:24:19.942092

In diesem Verfahren wird gezeigt, wie Sie einen Datenfluss erstellen, der anhand von Personennamensdaten (z. B. „John P. Smith“) gemeinsame Rufnamen desselben Namens identifiziert und eine Standardversion des Namens erstellt, mit der sich dann redundante Datensätze konsolidieren lassen.

Anmerkung: Vergewissern Sie sich vorab, dass Ihre Eingabedaten ein Feld mit der Bezeichnung „Name“ umfassen, das den vollständigen Namen der Person enthält.
  1. Wenn Sie es nicht bereits getan haben, laden Sie die folgenden Tabellen in den Spectrum Technology Platform-Server:
    • Open Parser Base
    • Open Parser Enhanced Names

    Laden Sie diese Tabellen über das Database Load Utility von Data Normalization. Anleitungen zum Laden von Tabellen finden Sie im Installationshandbuch.

  2. Erstellen Sie im Enterprise Designer einen neuen Datenfluss.
  3. Ziehen Sie einen Quellschritt auf die Arbeitsfläche.
  4. Doppelklicken Sie auf den Quellschritt und konfigurieren Sie ihn. Anweisungen zum Konfigurieren von Quellschritten finden Sie im Datenfluss-Designer-Handbuch.
  5. Ziehen Sie einen „Open Name Parser“-Schritt auf die Arbeitsfläche und verbinden Sie ihn mit dem Quellschritt.

    Wenn Sie beispielsweise einen „Read from File“-Schritt verwenden, sieht Ihr Datenfluss folgendermaßen aus:

    „Read from File“ im Datenfluss
  6. Ziehen Sie einen „Table Lookup“-Schritt auf die Arbeitsfläche und verbinden Sie ihn mit dem „Open Name Parser“-Schritt.

    Ihr Datenfluss sollte nun folgendermaßen aussehen:

    Open Name Parser stellt eine Verbindung mit dem im Datenfluss verbundenen „Table Lookup“-Schritt her.
  7. Doppelklicken Sie auf den „Table Lookup“-Schritt auf der Arbeitsfläche.
  8. Wählen Sie im Feld Quelle den Eintrag FirstName aus.
  9. Wählen Sie im Feld Ziel den Eintrag FirstName aus.

    Durch Angeben desselben Feldes sowohl als Quelle als auch als Ziel wird das Feld mit der standardisierten Version des Namens aktualisiert.

  10. Wählen Sie im Feld Tabelle den Eintrag NickNames.xml aus.
  11. Klicken Sie auf OK.
  12. Klicken Sie erneut auf OK, um das Fenster Table Lookup-Optionen zu schließen.
  13. Ziehen Sie einen Datenladeschritt auf die Arbeitsfläche und verbinden Sie ihn mit dem „Table Lookup“-Schritt.

    Würden Sie beispielsweise eine „Write to File“-Datenladung verwenden, würde Ihr Datenfluss jetzt so aussehen:

    „Write to File“ im Datenfluss
  14. Doppelklicken Sie auf den Datenladeschritt und konfigurieren Sie ihn. Anweisungen zum Konfigurieren von Quellschritten finden Sie im Datenfluss-Designer-Handbuch.

Sie haben jetzt einen Datenfluss, der anhand von Personennamen den Vornamen standardisiert und Rufnamen durch die Standardform des Namens ersetzt.