Este procedimiento describe cómo usar una etapa de Intraflow Match para identificar registros en un archivo que coincidan con otro archivo y en el mismo archivo. Por ejemplo, tiene dos archivos (archivos A y B) y desea ver si existen registros en el archivo A que coincidan con registros en el archivo B, pero también desea ver si existen registros en el archivo A que coincidan con otros registros en el archivo A. Puede lograr esto al usar Stream Combiner y una etapa de Intraflow Match.
- Genere un nuevo flujo de datos en Enterprise Designer.
- Arrastre hacia el lienzo una etapa de origen.
- Haga doble clic en la etapa de origen y configúrela. Consulte la Guía de Dataflow Designer para obtener instrucciones acerca de cómo configurar etapas de origen.
- Arrastre una segunda etapa de origen al lienzo y configúrelo para que lea el segundo origen de datos en el flujo de datos.
-
Arrastre una etapa Stream Combiner sobre el lienzo y conecte las dos etapas de origen a esta última.
Por ejemplo, si su flujo de datos tuvo dos etapas Read From File, luciría así después de agregar Stream Combiner:
-
Arrastre una etapa de Match Key Generator hacia el lienzo y conéctela a la etapa Stream Combiner.
Por ejemplo, su flujo de datos podría tener ahora el siguiente aspecto:
Match Key Generator crea una clave no exclusiva para cada registro, que posteriormente se puede usar en las etapas de comparación a fin de identificar grupos de registros potencialmente duplicados. Las claves de cruce facilitan el proceso de comparación al permitir la agrupación de registros por clave de cruce y posteriormente solo comparando los registros al interior de estos grupos.
- Haga doble clic en Match Key Generator.
- Haga clic en Agregar.
-
Defina la regla que se usará para generar una clave de cruce para cada registro.
Para obtener más información, consulte Opciones de Match Key Generator.
- Cuando haya terminado de definir la regla, haga clic en Aceptar.
- Si desea añadir reglas de cruce adicionales, haga clic en Agregar y añádalas, o bien haga clic en Aceptar cuando haya terminado.
-
Arrastre hacia el lienzo una etapa Interflow Match y conéctela a la etapa Match Key Generator.
Por ejemplo, su flujo de datos podría tener ahora el siguiente aspecto:
- Haga doble clic en Intraflow Match.
-
En el campo Cargar regla de cruce seleccione una de las reglas de cruce predefinidas, que puede usar como está o bien puede modificarla para que se ajuste a sus necesidades. Si desea crear una nueva regla de cruce sin usar una de las reglas de cruce predefinidas como punto de partida, haga clic en Nueva. Solamente puede tener una regla personalizada en un flujo de datos.
Nota: No utilice caracteres especiales cuando cree una regla nueva.Nota: La función Opciones del flujo de datos en Enterprise Designer permite exponer la regla de cruce para la configuración durante la ejecución.
-
En el campo Group by, seleccione MatchKey.
Esto colocará en un grupo los registros que tengan la misma clave de cruce. La regla de cruce se aplica a los registros en un grupo para ver si hay duplicados. La clave de cruce de cada registro será generada por la etapa Generate Match Key que configuró antes en este procedimiento.
- Para obtener más información acerca de cómo modificar las otras opciones, consulte Generación de reglas de cruce.
- Haga clic en Aceptar para guardar su configuración de Intraflow Match y vuelva al lienzo del flujo de datos.
-
Arrastre hacia el lienzo la etapa receptora y conéctela a la etapa Generate Match Key.
Por ejemplo, si estuviese utilizando la etapa receptora Write to File, su flujo de datos tendría el siguiente aspecto:
-
Haga doble clic en la etapa receptora y configúrela.
Para obtener información acerca de cómo configurar etapas receptoras, consulte la Guía de Dataflow Designer.