-
En el campo Cargar regla de cruce seleccione una de las reglas de cruce predefinidas, que puede usar como está o bien puede modificarla para que se ajuste a sus necesidades. Si desea crear una nueva regla de cruce sin usar una de las reglas de cruce predefinidas como punto de partida, haga clic en Nueva. Solamente puede tener una regla personalizada en un flujo de datos.
Nota: No utilice caracteres especiales cuando cree una regla nueva.Nota: La función Opciones del flujo de datos en Enterprise Designer permite exponer la regla de cruce para la configuración durante la ejecución.
- Haga clic en Agrupar por para seleccionar el campo que quiere utilizar para agrupar registros en la cola de cruce. Intraflow Match solamente intenta establecer cruces entre registros de la misma cola de cruce.
- Seleccione la casilla Ordenar para ordenar sus datos de entrada antes del cruce en el campo seleccionado en el campo Agrupar por.
-
Haga clic en Opciones avanzadas para especificar opciones de rendimiento de orden adicionales.
Nota: La configuración del rendimiento óptimo de orden depende de la configuración del hardware de su servidor. Esta ecuación se puede utilizar como pauta general para alcanzar un buen rendimiento del orden:
(InMemoryRecordLimit × MaxNumberOfTempFiles ÷ 2) >= TotalNumberOfRecords
-
Haga clic en Cruce inmediato en para realizar una comparación inicial de los valores de clave inmediata y determinar si se considerará que dos registros presentan un cruce.
El cruce de clave inmediato puede ser una herramienta útil para reducir el número de comparaciones realizadas y, de ese modo, mejorar la velocidad de ejecución. Una clave inmediata imprecisa genera muchos falsos positivos en el cruce. Usted puede generar una clave inmediata como parte de la creación de una clave de cruce por medio de MatchKeyGenerator. Consulte Match Key Generator para obtener más información.
Si dos registros presentan un cruce exacto en la clave inmediata, el candidato se considera un duplicado 100%. Si dos registros no presentan un cruce en el valor de clave inmediata, se los compara utilizando el método basado en reglas.
Para determinar si un candidato presenta un cruce utilizando una clave inmediata, observe el valor del campo ExpressKeyIdentified que será Y si hay cruce y N si no. Cabe destacar que los registros sospechosos siempre tienen un valor de N en ExpressKeyIdentified.
-
En el cuadro de texto Número de colección inicial especifique el número inicial que debe asignarse al campo de número de colección para los registros duplicados.
El número de colección identifica cada registro duplicado en una cola de cruce. A los registros únicos se les asigna un número de colección de 0. Cada registro duplicado recibe un número de colección a partir del valor especificado en el cuadro de texto Número de colección inicial.
-
Seleccione una de las siguientes opciones:
Opción Descripción Comparar el registro sospechoso con todos los candidatos Esta opción compara el registro sospechoso con todos los candidatos en el mismo grupo de cruce (agrupar según opción) aún cuando ya se haya encontrado un duplicado en el grupo de cruce. Por ejemplo: Sospechoso: John Smith
Candidato: Bill Jones
Candidato: John Smith
Candidato: John SmithEn el ejemplo, el registro sospechoso John Smith se comparará con ambos candidatos John Smith.
Marque la casilla Devolver candidatos únicos para devolver los registros dentro de un grupo de cruce del puerto candidato que hayan sido identificados como registros únicos.
Detener cruce de sospechosos con candidatos después de encontrar n duplicados Esta opción compara el registro sospechoso con todos los candidatos del mismo grupo de cruce (opción agrupar por), pero detiene el cruce cuando se identifica la cantidad de duplicados definida por el usuario. Por ejemplo, si decide detener la comparación de candidatos luego de encontrar un duplicado y cuenta con los siguientes datos: Sospechoso: John Smith
Candidato: Bill Jones
Candidato: John Smith
Candidato: John SmithEn el ejemplo, el registro sospechoso John Smith detendría la comparación dentro del grupo de cruce al identificarse como duplicado el primer candidato John Smith.
- Haga clic en Generar datos para análisis para generar resultados de cruce. Para obtener más información, consulte Análisis de resultados de cruce.
-
Al asignar el número de colección 0 a los registros únicos, marcados de forma predeterminada, se asignarán ceros como números de colección a los registros únicos. Desmarque esta opción para generar números de colección distintos a cero para los registros únicos. Los números de colección de los registros únicos estarán en secuencia con cualquiera de los otros números de colección. Por ejemplo, si su flujo de datos de cruce encuentra cinco registros y los tres primeros registros son únicos, los números de colección se asignarán como se muestra en el primer grupo a continuación. Si su flujo de datos de cruce encuentra cinco registros y los dos últimos son únicos, los números de colección se asignarán como se muestra en el segundo grupo a continuación.
Opción Descripción Número de colección Tipo de registro 1 Único 2 Único 3 Único 4 Duplicado/sospechoso 4 Duplicado/sospechoso Número de colección Tipo de registro 1 Duplicado/sospechoso 1 Duplicado/sospechoso 2 Único 3 Único 4 Único Si deja marcada esta opción, a todos los registros únicos que se encuentren en su flujo de datos se les asignará predeterminadamente un número de colección de cero. - Seleccione la opción Generar nombre de regla de cruce para incluir el nombre de regla de cruce seleccionada en la salida de la etapa.
-
Seleccione Devolver información detallada del cruce si desea que se muestre la información detallada del cruce como una salida para la regla de cruce. Para obtener información sobre los campos de salida, consulte Salida.
Nota: Si habilita este campo, dificultará el rendimiento general de la etapa.
- Si crea una nueva regla de comparación personalizada, consulte Generación de reglas de cruce para obtener más información.
- Haga clic en Evaluar para evaluar qué calificación obtuvo el registro sospechoso en comparación con los registros candidatos. Para obtener más información, consulte Interflow Match.