Interflow Match - dataflow_designer - spectrum_quality_1 - 23 - 23.1

Spectrum Data Quality-Handbuch

Product type
Software
Portfolio
Verify
Product family
Spectrum
Product
Spectrum > Qualität > Spectrum Quality
Version
23.1
Language
Deutsch
Product name
Spectrum Data Quality
Title
Spectrum Data Quality-Handbuch
First publish date
2007
Last updated
2023-10-25
Published on
2023-10-25T06:24:19.942092

Anhand dieses Schrittes werden Übereinstimmungen zwischen ähnlichen Datensätzen unter mehreren Eingabestreams ermittelt.

Interflow Match ermittelt Übereinstimmungen zwischen ähnlichen Datensätzen in zwei Eingabedatensatzstreams. Der erste Datensatzstream bildet eine Quelle für Kopfdubletten-Datensätze und der zweite Stream ist eine Quelle für Kandidatendatensätze.

Mithilfe von Übereinstimmungsgruppenkriterien (z. B. ein Vergleichsschlüssel) identifiziert Interflow Match eine Gruppe von Datensätzen, die möglicherweise Dubletten eines bestimmten Kopfdubletten-Datensatzes sind.

Jeder Kandidat wird einzeln mit der Kopfdublette abgeglichen und entsprechend Ihrer Vergleichsregeln mit einer Punktzahl versehen. Wenn es sich bei dem Kandidaten um eine Dublette handelt, wird ihm eine Sammlungsnummer zugewiesen, der übereinstimmende Datensatztyp wird als eine Dublette gekennzeichnet und ausgeschrieben. Die nicht übereinstimmenden eindeutigen Kandidaten können auf Wunsch des Benutzers ausgeschrieben werden. Wenn Interflow Match alle Kandidatendatensätze in der aktuellen Übereinstimmungsgruppe durchlaufen hat, wird dem übereinstimmenden Kopfdubletten-Datensatz eine Sammlungsnummer zugewiesen, die der Datensatzdublette entspricht. Wenn alternativ keine Übereinstimmungen ermittelt wurden, erhält die Kopfdublette die Sammlungsnummer 0 und wird als eindeutiger Datensatz gekennzeichnet.

Anmerkung: Interflow Match gleicht lediglich Kopfdubletten-Datensätze mit Kandidatendatensätzen ab. Es vergleicht keine Kopfdubletten-Datensätze mit anderen Kopfdubletten-Datensätzen, wie es bei Intraflow Match der Fall ist.

Der Vergleichsprozess für eine bestimmte Kopfdublette wird eventuell beendet, bevor alle möglichen Kandidaten verglichen werden, wenn Sie ein Limit für Dubletten festgelegt haben und dieses Limit für die aktuelle Kopfdublette überschritten wurde.

Der Vergleichstyp (Intraflow oder Interflow) bestimmt, wie Ergebnisse aus dem Schnellschlüsselvergleich in die Kandidatenpunktzahl umgewandelt werden. Beim Interflow-Vergleich überträgt ein erfolgreicher Schnellschlüsselvergleich stets ein MatchScore von 100 auf den Kandidaten. Auf der anderen Seite hängt beim Intraflow-Vergleich die Punktzahl, die ein Kandidat infolge eines Schnellschlüsselvergleichs erzielt, davon ab, ob der Datensatz, mit dem der Kandidat übereinstimmte, die Übereinstimmung einer anderen Kopfdublette war. Schnellschlüssel-Dubletten einer Kopfdublette erzielen immer ein MatchScore von 100, während Schnellschlüssel-Dubletten eines anderen Kandidaten (bei dem es sich um eine Dublette einer Kopfdublette handelte) den MatchScore (nicht unbedingt 100) dieses Kandidaten übernehmen werden.