Beheben von Datensatzdubletten - spectrum_quality_1 - 23 - 23.1

Spectrum Data Quality-Handbuch

Product type
Software
Portfolio
Verify
Product family
Spectrum
Product
Spectrum > Qualität > Spectrum Quality
Version
23.1
Language
Deutsch
Product name
Spectrum Data Quality
Title
Spectrum Data Quality-Handbuch
First publish date
2007
Last updated
2023-10-25
Published on
2023-10-25T06:24:19.942092
Ausnahmen bei der Dublettenauflösung treten auf, wenn Spectrum Technology Platform nicht sicher bestimmen kann, ob ein Datensatz eine Dublette eines anderen Datensatzes ist. Es gibt drei Wege, Datensatzdubletten zu beheben.
Anmerkung: Datensatzdubletten können nur mit der Funktion „Dubletten auflösen“ in der Tabellenansicht aufgelöst werden. Sie können diese Datensätze jedoch weiterhin in der Formularansicht bearbeiten.
Anmerkung: Wenn Sie in einem Genehmigungsfluss mit Datensatzdubletten arbeiten, finden Sie weitere Informationen im Abschnitt zu Genehmigungsflüssen.

Ein Ansatz ist die Gruppierung der Datensatzdubletten in Sammlungen. Wenn Sie die Datensätze genehmigen, können sie anschließend mithilfe eines Konsolidierungsvorgangs verarbeitet werden, um die Datensatzdubletten in jeder Sammlung in Ihren Daten zu eliminieren.

Ein weiterer Ansatz ist die Bearbeitung der Datensätze, damit sie wahrscheinlicher als Dubletten erkannt werden, z. B. durch die Korrektur der Schreibweise eines Straßennamens. Wenn Sie die Datensätze genehmigen, verarbeitet Spectrum Technology Platform die Datensätze erneut mithilfe eines Vergleichs- und Konsolidierungsprozesses. Nach erfolgreicher Korrektur der Datensätze kann Spectrum Technology Platform einen Datensatz als Dublette identifizieren.

Datensatzdubletten können außerdem behoben werden, indem Sie einen „Best of Breed“-Datensatz erstellen. Dadurch werden die zwei anderen Wege zur Behebung kombiniert, indem Sie Datensatzsammlungen verwalten und anschließend einen der Datensätze in der Sammlung bearbeiten, um Felder aus den Original- und Dublettendatensätzen einzubeziehen. Dieser Datensatz wird anschließend als „Best of Breed“-Datensatz bezeichnet.