In der folgenden Tabelle sind die Optionen für den Filter-Schritt aufgeführt.
Name der Option |
Beschreibung/gültige Werte |
---|---|
Gruppieren nach |
Gibt das Feld an, das zum Erstellen von zu filternden Datensatzgruppen verwendet werden soll. Der Filter-Schritt wird einen oder mehrere Datensätze aus jeder Gruppe beibehalten, je nachdem, wie Sie den Schritt konfigurieren. Wenn Sie den Vergleichsschritt früher im Datenfluss verwendet haben, z. B. bei Interflow Match, Intraflow Match oder Transactional Match, sollten Sie das Feld „CollectionNumber“ auswählen, um die vom Vergleichsschritt als Gruppen erstellten Sammlungen zu verwenden. Wenn Sie jedoch Datensätze nach einem anderen Feld gruppieren möchten, wählen Sie das Feld hier aus. Wenn Sie beispielsweise alle bis auf einen Datensatz aus den Datensätzen mit demselben Wert im Feld „AccountNumber“ herausfiltern möchten, müssten Sie „AccountNumber“auswählen. |
Sortieren |
Wenn Sie ein Feld im Gruppierungsfeld angeben, müssen Sie dieses Kästchen aktivieren, um die Datensätze nach dem Wert im ausgewählten Feld zu sortieren. Diese Option ist standardmäßig aktiviert. |
Erweitert |
Klicken Sie auf diese Schaltfläche, um die Optionen für die Sortierleistung anzugeben. Standardmäßig werden die Optionen für die Sortierleistung verwendet, die in der Management Console festgelegt sind. Es handelt sich dabei um die Standardleistungsoptionen für Ihr System. Wenn Sie die Standardleistungsoptionen Ihres Systems überschreiben möchten, müssen Sie das Kästchen Optionen für Sortierleistung außer Kraft setzen aktivieren und anschließend die für diese Felder gewünschten Werte angeben:
Anmerkung: Welche Einstellungen für die Sortierleistung optimal sind, hängt von der Hardwarekonfiguration Ihres Servers ab. Sie können diese Gleichung als allgemeine Richtlinie verwenden, um eine gute Sortierleistung zu erzielen:
Anmerkung: Welche Einstellungen für die Sortierleistung optimal sind, hängt von der Hardwarekonfiguration Ihres Servers ab. Sie können diese Gleichung als allgemeine Richtlinie verwenden, um eine gute Sortierleistung zu erzielen:
|
Anzahl zurückgegebener doppelter Datensätze beschränken |
Gibt die maximale Anzahl der Datensätze an, die aus jeder Gruppe zurückgegeben werden. Wenn Sie diese Option auf 1 einstellen, können Sie Filterregeln definieren, um zu bestimmen, welcher Datensatz in jeder Gruppe zurückgegeben werden soll. Wenn keine Regeln definiert sind, wird der erste Datensatz in jeder Sammlung zurückgegeben und der Rest wird verworfen. In diesem Modus definieren die Filterregeln, welcher Datensatz beibehalten wird. Wenn Sie beispielsweise eine Regel definieren, bei der der Datensatz mit der höchsten Punktzahl in einer Gruppe beibehalten wird, und Sie diese Option auf 1 einstellen, wird der Datensatz mit der höchsten Punktzahl in jeder Gruppe beibehalten und die anderen Datensätze in der Gruppe werden verworfen. Wenn Sie diese Option auf einen Wert über 1 einstellen, können Sie keine Filterregeln festlegen. Anmerkung: Wenn keiner der Datensätze in der Sammlung den definierten Regelkriterien entspricht, werden keine Datensätze aus der Gruppe zurückgegeben.
|
Duplikate aus Sammlung entfernen |
Gibt an, dass Filterregeln verwendet werden sollen, um zu bestimmen, welche Datensätze aus der Sammlung entfernt werden. Die restlichen Datensätze in der Sammlung werden beibehalten. Wenn diese Option aktiviert ist, müssen Sie eine Regel definieren. Anmerkung: Wenn lediglich ein Datensatz in einer Gruppe enthalten ist, werden die Filterregeln ignoriert und der Datensatz wird beibehalten.
|
Regeloptionen
Filterregeln bestimmen, welche Datensätze in einer Gruppe beibehalten oder entfernt werden sollen. Wenn Sie die Option Anzahl zurückgegebener doppelter Datensätze beschränken auswählen, bestimmen die Regeln, welche Datensätze nach dem Filtern erhalten bleiben. Wenn Sie die Option Duplikate aus Sammlung entfernen auswählen, bestimmen die Regeln, welche Datensätze aus dem Datenfluss entfernt werden.
Wählen Sie zum Hinzufügen einer Regel „Regeln“ in der Regelhierarchie aus, und klicken Sie auf Regel hinzufügen.
Wenn Sie mehrere Regeln angeben, müssen Sie einen logischen Operator auswählen, der zwischen jeder Regel zu verwenden ist. Wählen Sie And aus, wenn die neue Regel und die vorherige Regel beide erfüllt sein müssen, damit die Bedingung erfüllt ist. Wählen Sie Or aus, wenn entweder die vorherige Regel oder die neue Regel erfüllt sein muss, damit die Bedingung erfüllt ist.
Option | Beschreibung |
---|---|
Feldname |
Gibt den Namen des Datenflussfeldes an, dessen Wert Sie auswerten möchten, um zu bestimmen, ob der Datensatz gefiltert werden soll. |
Typ |
Gibt den Datentyp im Feld an. Zur Auswahl stehen:
|
Operator |
Gibt den Vergleichstyp an, den Sie zur Auswertung des Feldes verwenden möchten. Zur Auswahl stehen:
|
Werttyp |
Gibt den Werttyp an, den Sie mit dem Wert des Feldes vergleichen möchten. Zur Auswahl stehen: Anmerkung: Diese Option ist nicht verfügbar, wenn Sie den Operator „Höchste“, „Niedrigste“ oder „Längste“ auswählen.
|
Wert | Gibt den Wert an, der mit dem Wert des Feldes verglichen werden soll. Wenn Sie im Feld Feldtyp den Eintrag „Feld“ ausgewählt haben, müssen Sie ein Datenflussfeld auswählen. Wenn Sie im Feld Werttyp den Eintrag „Zeichenfolge“ ausgewählt haben, müssen Sie den bei dem Vergleich zu verwendenden Wert eingeben. Anmerkung: Diese Option ist nicht verfügbar, wenn Sie den Operator „Höchste“, „Niedrigste“ oder „Längste“ auswählen.
|
Beispiel einer Filterregel
Diese Regel behält in jeder Gruppe den Datensatz mit dem höchsten Wert im Feld „MatchScore“ bei. Hinweis: Die Optionen Wert und Werttyp gelten nicht, wenn der Operator „Höchste“ oder „Niedrigste“ eingestellt ist.
Feldname = MatchScore
Feldtyp = Numerisch
Operator = Höchste
Die Regel behält den Datensatz mit dem Wert „12345“ im Feld „AccountNumber“ bei.
Feldname = AccountNumber
Feldtyp= Numerisch
Operator = Gleich
Werttyp = Zeichenfolge
Wert = 12345