Entwerfen eines Datenflusses zur Handhabung von Ausnahmen - spectrum_quality_1 - 23 - 23.1

Spectrum Data Quality-Handbuch

Product type
Software
Portfolio
Verify
Product family
Spectrum
Product
Spectrum > Qualität > Spectrum Quality
Version
23.1
Language
Deutsch
Product name
Spectrum Data Quality
Title
Spectrum Data Quality-Handbuch
First publish date
2007
Last updated
2023-10-25
Published on
2023-10-25T06:24:19.942092
Wenn Sie über eine Lizenz für Data Stewardship verfügen, können Sie einen Ausnahmeverwaltungsprozess in Ihre Datenflüsse einschließen. Die Standardbausteine eines Ausnahmeverwaltungsprozesses umfassen:
  • Einen ursprünglichen Datenfluss, über den ein Datenqualitätsprozess durchgeführt wird, wie z. B. die Deduplizierung eines Datenflusses, eine Adressenüberprüfung oder Geocoding.
  • Ein Schritt vom Typ „Exception Monitor“, in dem Datensätze identifiziert werden, die nicht verarbeitet werden konnten.
  • Ein Schritt vom Typ „Write Exceptions“, in dem die in Schritt „Exception Monitor“ identifizierten Ausnahmedatensätze genommen und zur manuellen Überprüfung in die Ausnahme-Datenbank geschrieben werden.
  • Das Data Stewardship Portal, eine browserbasierte Lösung, mit der Sie Ausnahmedatensätze überprüfen und bearbeiten können. Nachdem Datensätze bearbeitet wurden, werden sie aufgelöst und erneut verarbeitet.
  • Einen Auftrag zur erneuten Verarbeitung von Ausnahmen, der mithilfe des Schritts „Read Exceptions“ genehmigte Datensätze aus der Ausnahme-Datenbank in den Auftrag liest. Anschließend wird in dem Datenfluss versucht, die korrigierten Datensätze erneut zu verarbeiten. Normalerweise wird hierbei die gleiche Logik verwendet wie beim ursprünglichen Datenfluss. In Schritt „Exception Monitor“ wird erneut überprüft, ob Ausnahmen vorliegen. Anschließend werden in Schritt „Write Exceptions“ Ausnahmen für eine zusätzliche Überprüfung zurück in die Ausnahme-Datenbank geschrieben.
Anmerkung: Platzieren Sie keine anderen Schritte zwischen „Exception Monitor“- und „Write Exceptions“-Schritten in einem Datenfluss. Dadurch könnte die Ausnahmekonfiguration im Data Stewardship Portal beeinträchtigt werden.

Im Folgenden wird ein Beispielszenario dargestellt, das die grundlegende Implementierung einer Ausnahmenverwaltung verdeutlicht:

Zwei Datenflüsse veranschaulichen die grundlegende Ausnahmeverwaltung

In diesem Beispiel gibt es zwei Datenflüsse: den ursprünglichen Datenfluss, in dem die Postleitzahlendaten der Eingabedatensätze ausgewertet werden, und der Auftrag zur erneuten Verarbeitung von Ausnahmen, in dem anhand bearbeiteter Ausnahmen überprüft wird, ob die Datensätze jetzt gültige Postleitzahlendaten enthalten.

In beiden Datenflüssen gibt es den Schritt „Exception Monitor“. Dieser Schritt enthält die Bedingungen, mit denen Sie bestimmen möchten, ob ein Datensatz zur manuellen Überprüfung weitergeleitet werden soll. Diese Bedingungen bestehen aus mindestens einem Ausdruck, z. B.: PostalCode is empty. Dies bedeutet, dass alle Datensätze, die keine Postleitzahl enthalten, als Ausnahme gelten, in den Schritt „Write Exceptions“ weitergeleitet und in die Ausnahme-Datenbank geschrieben würden. Weitere Informationen finden Sie unter Exception Monitor.

Alle von Exception Monitor identifizierten Datensätze werden mithilfe des Schritts „Write Exceptions“ an eine Ausnahme-Datenbank weitergeleitet. Data Stewards überprüfen die Ausnahmen im Repository über das Data Stewardship Portal, einer browserbasierten Lösung zum Anzeigen und Ändern von Ausnahmedatensätzen. In unserem Beispiel könnte der Data Steward mit dem Editor im Data Stewardship Portal manuell Postleitzahlen zu den Ausnahmedatensätzen hinzufügen und diese als „Genehmigt“ markieren.

Sobald ein Datensatz im Data Stewardship Portal als „Aufgelöst“ markiert wurde, steht der Datensatz zum Einlesen in einen Spectrum Technology Platform-Datenfluss zur Verfügung. Dies geschieht durch Verwendung des Schritts „Read Exceptions“. Wenn bestimmte Datensätze weiterhin zu einer Ausnahme führen, werden sie erneut in das Ausnahme-Repository geschrieben, damit ein Data Steward sie überprüft.

Die folgenden Fragen sollen Ihnen dabei helfen, den besten Ansatz für Ihre Situation zu finden:
  • Wie sollen Ausnahmedatensätze identifiziert werden? Im Schritt „Exception Monitor“ kann der Wert eines beliebigen Feldes oder eine beliebige Kombination aus Feldern ausgewertet werden, um zu ermitteln, ob ein Datensatz eine Ausnahme darstellt. Sie sollten die Ergebnisse analysieren, die Sie derzeit über Ihren Datenfluss abrufen, um zu ermitteln, wie Datensätze identifiziert werden sollen. Sie sollten Datensätze im Mittelbereich der gleichbleibend hohen Datenqualität identifizieren und nicht Datensätze, die genau überprüft wurden oder deutlich fehlgeschlagen sind.
  • Sollen bearbeitete und genehmigte Ausnahmedatensätze mit der gleichen Logik erneut verarbeitet werden, die auch im ursprünglichen Datenfluss verwendet wurde? Wenn ja, dann sollten Sie einen Unterfluss verwenden, um eine wiederverwendbar Geschäftslogik zu erstellen. Der Unterfluss könnte beispielsweise in einem ursprünglichen Datenfluss verwendet werden, in dem die Adressenüberprüfung durchgeführt wird, und in einem Auftrag zur erneuten Verarbeitung von Ausnahmen, in dem die korrigierten Datensätze zur Überprüfung der Korrekturen erneut verarbeitet werden. Anschließend können Sie unterschiedliche Quellschritte und Schritte zum Laden von Daten für den Datenfluss verwenden. Der ursprüngliche Datenfluss enthält möglicherweise den Schritt „Read from DB“, in dem Daten zur Verarbeitung aus Ihrer Kundendatenbank entnommen werden. Der Auftrag zur erneuten Verarbeitung von Ausnahmen enthält möglicherweise den Schritt „Read Exceptions“, in dem die bearbeiteten und genehmigten Ausnahmedatensätze aus der Ausnahme-Datenbank entnommen werden.
  • Sollen korrigierte und genehmigte Ausnahmen in einem vordefinierten Zeitplan erneut verarbeitet werden? Wenn ja, können Sie Ihren Auftrag zur erneuten Verarbeitung über „Planung“ in der Management Console planen.