Comparación de registros de un origen a otro origen - spectrum_quality_1 - 23.1

Guía de Spectrum Data Quality

Product type
Portfolio
Verify
Product family
Spectrum
Product
Spectrum > Quality > Spectrum Quality
Version
23.1
Language
Español (México)
Product name
Spectrum Data Quality
Title
Guía de Spectrum Data Quality
First publish date
2007
Last updated
2024-02-07
Published on
2024-02-07T17:21:06.785000

Este procedimiento describe cómo usar una etapa de Interflow Match para identificar registros en un origen que coincidan con registros en otro origen. El primer origen contiene registros sospechosos y el segundo contiene registros candidatos. El flujo de datos solo hace coincidir registros de un origen con registros en otro origen. No intenta hacer coincidir registros desde el interior del mismo origen. El flujo de datos agrupa los registros en colecciones de registros coincidentes y escribe dichas colecciones en un archivo de salida.

  1. Genere un nuevo flujo de datos en Enterprise Designer.
  2. Arrastre hacia el lienzo dos etapas de origen. Configure una de ellas apuntando a los registros sospechosos y la otra a origen de registros candidatos.

    Consulte la Guía de Dataflow Designer para obtener instrucciones acerca de cómo configurar etapas de origen.

  3. Arrastre hacia el lienzo una etapa Match Key Generator y conéctela a una de las etapas de origen.

    Por ejemplo, si está utilizando una etapa de origen Read from File, su flujo de datos tendrá ahora el siguiente aspecto:

    Read from File en flujos de datos

    Match Key Generator crea una clave no exclusiva para cada registro, que posteriormente se puede usar en las etapas de comparación a fin de identificar grupos de registros potencialmente duplicados. Las claves de cruce facilitan el proceso de comparación al permitir la agrupación de registros por clave de cruce y posteriormente solo comparando los registros al interior de estos grupos.

    Nota: Más adelante añadirá una segunda etapa Match Key Generator. Por el momento necesitará en el lienzo solamente una.
  4. Haga doble clic en la etapa Match Key Generator.
  5. Haga clic en Agregar.
  6. Defina la regla que se usará para generar una clave de cruce para cada registro.
    Para obtener más información, consulte Opciones de Match Key Generator.
  7. Cuando haya terminado de definir la regla, haga clic en Aceptar.
  8. Haga clic derecho en la etapa Match Key Generator en el lienzo y seleccione Copiar etapa.
  9. Haga clic derecho en un área vacía del lienzo y seleccione Pegar.
  10. Conecte la copia de Match Key Generator a la otra etapa de origen.

    Por ejemplo, si está usando las etapas de entrada Read from File, su flujo de datos tendrá ahora el siguiente aspecto:

    Read from File en flujos de datos

    El flujo de datos contiene ahora dos etapas Match Key Generator que producen claves de cruce para cada origen, y que usan exactamente las mismas reglas. Configurar de forma idéntica las etapas Match Key Generator es esencial para el apropiado funcionamiento de este flujo de datos.

  11. Arrastre hacia el lienzo una etapa Interflow Match y conecte a esta cada una de las etapas Match Key Generator.

    Por ejemplo, si está usando las etapas de entrada Read from File, su flujo de datos tendrá ahora el siguiente aspecto:

    Interflow Match en flujos de datos
  12. Haga doble clic en la etapa Interflow Match.
  13. En el campo Cargar regla de cruce seleccione una de las reglas de cruce predefinidas, que puede usar como está o bien puede modificarla para que se ajuste a sus necesidades. Si desea crear una nueva regla de cruce sin usar una de las reglas de cruce predefinidas como punto de partida, haga clic en Nueva. Solamente puede tener una regla personalizada en un flujo de datos.
    Nota: No utilice caracteres especiales cuando cree una regla nueva.
    Nota: La función Opciones del flujo de datos en Enterprise Designer permite exponer la regla de cruce para la configuración durante la ejecución.
  14. En el campo Group by, seleccione MatchKey.

    Esto colocará en un grupo los registros que tengan la misma clave de cruce. La regla de cruce se aplica a los registros en un grupo para ver si hay duplicados. La clave de cruce para cada registro será generada por las etapas Generate Match Key que configuró antes en este procedimiento.

  15. Para obtener más información acerca de cómo modificar las otras opciones, consulte Generación de reglas de cruce.
  16. Arrastre hacia el lienzo una etapa receptora y conéctela a la etapa Interflow Match.

    Por ejemplo, si estuviese utilizando la etapa receptora Write to File, su flujo de datos tendría el siguiente aspecto:

    Write to File en flujos de datos
  17. Haga doble clic en la etapa receptora y configúrela.

    Para obtener información acerca de cómo configurar etapas receptoras, consulte la Guía de Dataflow Designer.

Ahora cuenta con un flujo de datos que se corresponderá con los registros de dos orígenes de datos.

Cruce de registros a partir de orígenes diversos

Como empresa de marketing directo, usted desea identificar a las personas que están en una lista de "no enviar correos" de modo que no se les envíen correos. Tiene una lista de destinatarios en un archivo, y en otro archivo tiene una lista de personas que no desean recibir publicidad por correo (es decir, un archivo para eliminaciones).

El siguiente flujo de datos entrega una solución para esta situación empresarial:

Flujo de datos de la solución de una situación hipotética empresarial

La etapa Read from File lee los datos de su lista de correos y la etapa Read from File 2 lee los datos de la lista de eliminaciones. Las dos etapas Match Key Generator están configuradas en forma idéntica, por lo que generan una clave de cruce que puede ser utilizada en Interflow Match para conformar grupos de posibles cruces. Interflow Match identifica registros en la lista de correos que están además en el archivo de eliminaciones y marca dichos registros como duplicados. Conditional Router envía registros únicos, lo que quiere decir que aquellos registros que no se encontraron en la lista de eliminaciones, son enviados a Write to File para que sean escritos en un archivo. La etapa Conditional Router envía todos los demás registros a Write to Null, en donde son descartados.