Registerkarte „Konfiguration“ - dataflow_designer - spectrum_quality_1 - 23 - 23.1

Spectrum Data Quality-Handbuch

Product type
Software
Portfolio
Verify
Product family
Spectrum
Product
Spectrum > Qualität > Spectrum Quality
Version
23.1
Language
Deutsch
Product name
Spectrum Data Quality
Title
Spectrum Data Quality-Handbuch
First publish date
2007
Last updated
2023-10-25
Published on
2023-10-25T06:24:19.942092

Diese Registerkarte wird im Dialogfeld Exception Monitor-Optionen angezeigt.

Exception Monitor deaktivieren
Schaltet Exception Monitor ein oder aus. Wenn Sie Exception Monitor deaktivieren, durchlaufen Datensätze einfach den Schritt, ohne dass Maßnahmen ergriffen werden müssen. Dies ist vergleichbar mit dem Entfernen von Exception Monitor aus dem Datenfluss.
Auftrag nach Erreichen der Ausnahmenobergrenze beenden
Gibt an, ob die Ausführung des Auftrags abgebrochen werden soll, wenn die angegebene Anzahl der Datensätze die Ausnahmebedingungen erfüllt.
Maximale Anzahl von Ausnahmedatensätzen
Wenn die Option Auftrag nach Erreichen der Ausnahmenobergrenze beenden ausgewählt wurde, können Sie in diesem Feld die maximal zulässige Anzahl der Ausnahmedatensätze angeben, bevor die Ausführung des Auftrags abgebrochen wird. Wenn Sie beispielsweise 100 angeben, wird der Auftrag beendet, sobald der 101. Datensatz aufgetreten ist.
Nur Bericht (keine Ausnahmen erstellen)
Ermöglicht es Ihnen, Datensätze nachzuverfolgen, die Ausnahmebedingungen erfüllen, und meldet diese Statistiken auf der Seite „Data Quality Performance“ im Data Stewardship Portal. Mit der Option werden jedoch keine Ausnahmen für diese Datensätze erstellt.
Alle Datensätze in der Gruppe der Ausnahme zurückgeben
Gibt an, ob alle Datensätze zurückgegeben werden sollen, die zu der Gruppe des Ausnahmedatensatzes gehören, statt nur den Datensatz zurückzugeben. Beispiel: Eine Übereinstimmungsgruppe (basierend auf einem Übereinstimmungsschlüssel) enthält vier Datensätze. Bei einem handelt es sich um die Datensatzkopfdublette, bei dem anderen um eine Dublette mit einer Punktzahl von 90 und bei den zwei letzten Datensätzen handelt es sich um eindeutige Datensätze mit einer Punktzahl von 80 und 83. Wenn Sie über eine Bedingung verfügen, in der angegeben wird, dass jeder Datensatz mit einem MatchScore zwischen 80 und 89 eine Ausnahme darstellt, würden standardmäßig nur die Datensätze mit einem MatchScore von 80 und 83 an den Ausnahmeport gesendet werden. Wenn Sie diese Option aktivieren, würden jedoch alle vier Datensätze an den Ausnahmeport gesendet werden.
Aktivieren Sie diese Option, wenn Sie möchten, dass Dateneigner den Ausnahmedatensatz mit anderen Datensätzen in der Gruppe vergleichen können. Durch den Vergleich aller Datensätze in der Gruppe können Dateneigner möglicherweise fundiertere Entscheidungen bzgl. der Handhabung eines Ausnahmedatensatzes treffen. In einer Vergleichssituation könnte ein Dateneigner beispielsweise alle Kandidaten sehen, um zu ermitteln, ob es sich bei der Ausnahme um eine Dublette handelt.
Anmerkung: Wenn die Eingabedaten kein Feld mit dem Namen „CollectionNumber“ enthalten, wird diese Option deaktiviert.
Gruppieren nach
Wenn Sie Alle Datensätze in der Gruppe der Ausnahme zurückgeben ausgewählt haben, wählen Sie das Feld aus, nach dem die Datensätze gruppiert werden sollen.
Anmerkung: Das Eingabefeld „Sammlungsnummer“ wird in dieser Liste nicht angezeigt, da es bei dem Feature „Gruppieren nach“ keine gültige Auswahl darstellt.
Dienst für erneute Überprüfung
Wählen Sie den Dienst aus, der ausgeführt werden soll, wenn Sie Datensätze aus diesem Datenfluss erneut überprüfen. Der Dienst wird ausgeführt, wenn Benutzer bearbeitete Datensätze im Ausnahmen-Editor des Portals speichern. Der Status wird für Datensätze, bei denen die erneute Überprüfung fehlschlägt, in Failed geändert. Erfolgreich erneut überprüfte Datensätze werden je nach Auswahl für Aktion nach erneuter Überprüfung erneut verarbeitet oder genehmigt.
In einem Genehmigungsfluss werden erfolgreich erneut überprüfte Datensätze an die nächste Genehmigungsebene weitergeleitet. Für die letzte Genehmigungsebene in einem Genehmigungsfluss werden erneut überprüfte Datensätze entweder zur erneuten Verarbeitung freigegeben oder im Repository als Resolved aufbewahrt, je nach Auswahl für Aktion nach erneuter Überprüfung.
Aktion nach erneuter Überprüfung
Gibt an, ob Datensätze erneut verarbeitet werden sollen oder ob Datensätze, die erneut überprüft worden sind, genehmigt werden sollen.
  • Datensätze erneut verarbeiten: Wählen Sie diese Option aus, um Datensätze, die erfolgreich erneut überprüft wurden, erneut zu verarbeiten. Die erneut überprüften Datensätze werden zur erneuten Verarbeitung aus dem Repository entfernt.
  • Datensätze genehmigen: Wählen Sie diese Option aus, um Datensätze, die erfolgreich erneut überprüft wurden, zu genehmigen. Die genehmigten Datensätze werden im Repository aufbewahrt und ihr Status wird in Resolved geändert.
Ausnahmedatensätze anhand von Vergleichsfeld vergleichen
Verwendet Vergleichsfelder, um Eingabedatensätze mit Ausnahmedatensätzen in der Datenbank zu vergleichen. Aktivieren Sie diese Option, wenn Ihre Eingabe Datensätze enthält, durch die zuvor Ausnahmen generiert wurden, die jedoch jetzt in der Eingabe korrigiert wurden.

Die Eingabedatensätze werden auf Basis der Bedingungen ausgewertet und anschließend mit den vorhandenen Ausnahmedatensätzen in der Datenbank verglichen. Wenn ein Eingabedatensatz die Bedingungen erfüllt und mit einem Ausnahmedatensatz übereinstimmt, wird dieser Datensatz aus der Datenbank entfernt. Wenn ein Eingabedatensatz die Bedingungen nicht erfüllt und mit einem Ausnahmedatensatz übereinstimmt, wird dieser Datensatz aktualisiert und bleibt in der Datenbank erhalten. Wenn in der Datenbank Dubletten vorhanden sind, wird zudem nur eine übereinstimmende Ausnahme pro Datenfluss aktualisiert. Alle anderen Dubletten dieses Datenflusses werden gelöscht.

Optimiert für einzelne Datensätze oder kleine Batches
Diese Option ist aktiviert, wenn Sie Ausnahmedatensätze anhand von Vergleichsfeld vergleichen aktivieren. Wenn diese Option nicht aktiviert ist (Standardeinstellung), lädt der Server alle vorhandenen Ausnahmedatensätze für den aktuellen Datenfluss und Schritt, bevor die eingehenden Ausnahmedatensätze verarbeitet werden. Dies wird empfohlen, wenn das Repository über eine geringe Anzahl vorhandener Ausnahmedatensätze und eine hohe Anzahl neuer Ausnahmedatensätze oder Aktualisierungen verfügt. Dieses Szenario beinhaltet normalerweise eine längere Anfangsladezeit und einen erhöhten Speicherbedarf. Es ist schneller, wenn größere Batches verarbeitet werden, z. B. tägliche, wöchentliche oder monatliche Aktualisierungen.

Das Aktivieren dieser Option wird empfohlen, wenn das Repository eine große Anzahl vorhandener Ausnahmedatensätze und eine relativ geringe Anzahl neuer Ausnahmedatensätze oder Aktualisierungen enthält, da der Server das Repository nach vorhandenen Ausnahmedatensätzen abfragt, wenn die einzelnen Eingabedatensätze eingelesen werden. Dieses Szenario beinhaltet normalerweise eine kürzere Anfangsladezeit und einen geringeren Speicherbedarf. Es ist schneller, wenn einige Datensätze in Echtzeit verarbeitet werden.

Vergleichsfelder
Enthält eine Liste mit allen Eingabefeldern, die zum Erstellen eines Schlüssels für den Vergleich eines Ausnahmedatensatzes in der Datenbank verwendet werden. Sie müssen mindestens ein Vergleichsfeld definieren, wenn Sie das Feld Ausnahmedatensätze anhand von Vergleichsfeld vergleichen aktiviert haben.