Standardisieren von Begriffen - spectrum_quality_1 - 23 - 23.1

Spectrum Data Quality-Handbuch

Product type
Software
Portfolio
Verify
Product family
Spectrum
Product
Spectrum > Qualität > Spectrum Quality
Version
23.1
Language
Deutsch
Product name
Spectrum Data Quality
Title
Spectrum Data Quality-Handbuch
First publish date
2007
Last updated
2023-10-25
Published on
2023-10-25T06:24:19.942092

Die inkonsistente Verwendung von Begriffen kann ein Datenqualitätsproblem sein, das Schwierigkeiten beim Parsen, bei Suchvorgängen und mehr verursacht. Sie können einen Datenfluss erstellen, der Begriffe in Ihren Daten findet, die inkonsistent verwendet werden, und sie standardisieren. Wenn Ihre Daten etwa die Begriffe „Incorporated“, „Inc.“ und „Inc“ enthalten, können Sie einen Datenfluss erstellen, um eine Form als Standardform festzulegen (z. B. „Inc.“).

Anmerkung: Vor dem Ausführen dieses Verfahrens muss Ihr Administrator die Data Normalization-Datenbank installieren. Diese Datenbank enthält standardisierte Begriffe, die auf Ihre Daten angewendet werden sollen. Eine Anleitung zum Installieren von Datenbanken finden Sie im Installationshandbuch.
  1. Erstellen Sie im Enterprise Designer einen neuen Datenfluss.
  2. Ziehen Sie einen Quellschritt auf die Arbeitsfläche.
  3. Doppelklicken Sie auf den Quellschritt und konfigurieren Sie ihn. Anweisungen zum Konfigurieren von Quellschritten finden Sie im Datenfluss-Designer-Handbuch.
  4. Ziehen Sie einen „Table Lookup“-Schritt auf die Arbeitsfläche und verbinden Sie ihn mit dem Quellschritt.

    Bei Verwendung eines „Read from File“-Quellschrittes würde Ihr Datenfluss so aussehen:

    „Read from File“ im Datenfluss
  5. Doppelklicken Sie auf den „Table Lookup“-Schritt auf der Arbeitsfläche.
  6. Um die Optionen für das Table Lookup anzugeben, müssen Sie eine Regel erstellen. Sie können mehrere Regeln erstellen und dann die Reihenfolge angeben, in der die Regeln angewendet werden sollen. Klicken Sie auf Hinzufügen, um eine Regel zu erstellen.
  7. Lassen Sie im Feld Aktion die Standardoption Standardisieren ausgewählt.
  8. Lassen Sie im Feld Für die Option Vollständiges Feld ausgewählt, wenn das ganze Feld der Begriff ist, den Sie standardisieren möchten. Oder wählen Sie Einzelne Begriffe im Feld, um einzelne Wörter im Feld zu standardisieren.
  9. Wählen Sie im Feld Quelle das Feld aus, das Sie standardisieren möchten.
  10. Wählen Sie im Feld Ziel das Feld aus, das den standardisierten Begriff enthalten soll. Wenn Sie dasselbe Feld wie das Quellenfeld angeben, wird der Wert des Quellenfeldes durch den standardisierten Begriff ersetzt.
  11. Wählen Sie im Feld Tabelle die Tabelle aus, die die standardisierten Begriffe enthält.
    Anmerkung: Wenn Sie die erforderliche Tabelle nicht sehen, setzen sich mit Ihrem Systemadministrator in Verbindung. Die Data Normalization-Datenbank muss geladen sein.
  12. Wählen Sie im Feld Wenn Tabellenwert nicht gefunden wird, Zielwert festlegen auf die Option Quellwert aus.
  13. Klicken Sie auf OK.
  14. Definieren Sie zusätzliche Regeln, wenn Werte in mehr Feldern standardisiert werden sollen. Klicken Sie auf OK, wenn Sie alle Regeln definiert haben.
  15. Ziehen Sie einen Datenladeschritt auf die Arbeitsfläche und verbinden Sie ihn mit „Table Lookup“.

    Bei Verwendung von „Write to File“ würde Ihr Datenfluss so aussehen:

    „Write to File“ im Datenfluss
  16. Doppelklicken Sie auf den Datenladeschritt und konfigurieren Sie ihn.

    Weitere Informationen zum Konfigurieren von Datenladeschritten finden Sie im Datenfluss-Designer-Handbuch.

Sie haben jetzt einen Datenfluss, der Begriffe standardisiert.