Creación de un registro Best of Breed. - spectrum_quality_1 - 23.1

Guía de Spectrum Data Quality

Product type
Portfolio
Verify
Product family
Spectrum
Product
Spectrum > Quality > Spectrum Quality
Version
23.1
Language
Español (México)
Product name
Spectrum Data Quality
Title
Guía de Spectrum Data Quality
First publish date
2007
Last updated
2024-02-07
Published on
2024-02-07T17:21:06.785000

Para eliminar de sus datos registros duplicados, puede decidir combinar dichos datos a partir de grupos de registros duplicados en un único registro "best of breed". Esta metodología es conveniente cuando cada registro duplicado contiene datos del mismo tipo (por ejemplo, números telefónicos o nombres) y desea conservar los mejores datos de cada registro en el registro sobreviviente.

Este procedimiento describe la forma de crear un flujo de datos que combine registros duplicados en un registro best of breed.

  1. En Enterprise Designer, cree un flujo de datos que identifique los registros duplicados mediante comparación.

    El cruce es el primer paso en la desduplicación, ya que se necesita identificar registros que son similares, como por ejemplo registros que tienen el mismo número de cuenta o nombre. Consulte las siguientes secciones para obtener instrucciones acerca de la creación de flujo de datos que realicen cruce de registros.

    Nota: Solo necesita generar el flujo de datos en el punto donde lee datos y realiza el cruce con una etapa Interflow Match, Intraflow Match o Transactional Match. Cuando haya creado el flujo de datos hasta este punto, siga adelante con los pasos siguientes.
  2. Cuando haya definido un flujo de datos que lee datos y cruza registros, arrastre hacia el lienzo una etapa Best of Breed y conéctela a la etapa que realiza el cruce (Interflow Match, Intraflow Match o Transactional Match).

    Por ejemplo, si su flujo de datos lee datos de un archivo y realiza un cruce con Intraflow Match, su flujo de datos tendrá el siguiente aspecto luego de añadir una etapa Best of Breed:

    Etapa Best of Breed en flujos de datos
  3. Haga doble clic en el lienzo en la etapa Best of Breed.
  4. En el campo Agrupar por, seleccione CollectionNumber.
  5. En Configuración de Best of Breed, seleccione Reglas en el árbol de condiciones.
  6. Haga clic en Agregar regla.

    Los registros de cada grupo son evaluados para ver si cumplen con las reglas que defina aquí. Si un registro coincide con una regla, sus datos pueden copiarse en el registro best of breed, dependiendo de cómo se hayan configurado las acciones asociadas a la regla. Definirá las acciones más adelante.

  7. Defina una regla que un registro duplicado deba cumplir a fin de que sus datos sean copiados en el registro best of breed.

    Configure las opciones para definir una regla. Para obtener más información, consulte Opciones de reglas

  8. Haga clic en Aceptar.
  9. Haga clic en el nodo Acciones en el árbol.
  10. Haga clic en Agregar acción.
  11. Especifique los datos que se copiarán en el registro best of breed si es que dicho registro cumple con los criterios definidos en la regla.
    Para obtener más información, consulte Opciones de acciones.
  12. Haga clic en Aceptar.

    Ahora ha configurado Best of Breed con una regla y una acción. Puede añadir reglas y acciones adicionales en caso necesario.

  13. Haga clic en Aceptar para cerrar la ventana de Opciones de Best of Breed.
  14. Arrastre hacia el lienzo una etapa receptora y conéctela a la etapa Best of Breed.

    Por ejemplo, si estuviese utilizando la etapa receptora Write to File, su flujo de datos tendría el siguiente aspecto:

    Write to File en flujos de datos
  15. Haga doble clic en la etapa receptora y configúrela.

    Para obtener información acerca de cómo configurar etapas receptoras, consulte la Guía de Dataflow Designer.

Ahora tiene un flujo de datos que identifica registros coincidentes y combina los registros dentro de una colección en un único registro best of breed.