Método de comparación predeterminado - dataflow_designer - spectrum_quality_1 - 23.1

Guía de Spectrum Data Quality

Product type
Portfolio
Verify
Product family
Spectrum
Product
Spectrum > Quality > Spectrum Quality
Version
23.1
Language
Español (México)
Product name
Spectrum Data Quality
Title
Guía de Spectrum Data Quality
First publish date
2007
Last updated
2024-02-07
Published on
2024-02-07T17:21:06.785000

Al utilizar la función Agrupar por (grupo de cruce) configurada por el usuario, la función de cruce identifica grupos de registro que podrían ser duplicados entre sí. Luego, la función de cruce analiza cada registro del grupo; si un registro coincide con un registro Sospechoso existente, se lo considera un Duplicado de ese sospechoso, se le asigna una Calificación, un CollectionNumber (Número de colección) y un MatchRecordType (Tipo de registro de cruce) (Duplicado), y se lo elimina del cruce. Por el contrario, si el registro no coincide con un Sospechoso existente dentro del grupo de cruce, el registro se convierte en un nuevo Sospechoso, porque se lo agrega al actual Grupo de cruce para que pueda ser comparado con los próximos registros. Cuando el comparador ha agotado todos los registros en el grupo actual de cruce, elimina a todos los sospechosos del cruce, etiquetando el tipo de registro de coincidencia como único y asignando un número de colección de 0. Aquellos sospechosos con, al menos, un duplicado conservarán un tipo de registro de cruce de Sospechoso y se le asigna el mismo número de colección que su registro duplicado coincidente. Finalmente, cuando todos los registros dentro de un grupo de cruce han sido escritos en la salida, Un nuevo grupo de cruce se compara.

Nota: El Método de comparación predeterminado solo compara registros que están dentro del mismo grupo de cruce.

El tipo de comparación (Intraflow or Interflow, intraflujo o interflujo) determina la forma en que los resultados del cruce de clave inmediato se reflejan en las calificaciones de cruce de candidatos. En la comparación de interflujo, un cruce de clave inmediato que se realiza con éxito siempre confiere una calificación de cruce (MatchScore) de 100 al candidato. Por otra parte, en la comparación de intraflujo, la calificación obtenida por un registro candidato como resultado de un cruce de clave inmediato dependerá de la posibilidad de que el registro cruzado con el candidato sea un cruce (coincidencia) de algún otro registro sospechoso: los duplicados de un registro sospechoso detectados por medio del cruce de clave inmediato siempre tendrán una calificación de cruce (MatchScore) de 100, en tanto los duplicados de cruce de clave inmediato de otro candidato (que era un duplicado de un registro sospechoso) heredarán la calificación de cruce (no necesariamente 100) de ese candidato.