Generación de reglas de cruce - spectrum_quality_1 - 23.1

Guía de Spectrum Data Quality

Product type
Portfolio
Verify
Product family
Spectrum
Product
Spectrum > Quality > Spectrum Quality
Version
23.1
Language
Español (México)
Product name
Spectrum Data Quality
Title
Guía de Spectrum Data Quality
First publish date
2007
Last updated
2024-02-07
Published on
2024-02-07T17:21:06.785000

Las reglas de cruce se usan en Interflow Match, Intraflow Match y Transactional Match para definir los criterios que se utilizan para determinar si un registro coincide con otro. Las reglas de cruce especifican los campos que se van a comparar y cómo van a compararse, así como una jerarquía de comparaciones para las reglas de comparación complejas.

Puede generar reglas de cruce en Interflow Match, Intraflow Match y Transactional Match. También puede generar reglas de cruce en la herramienta Match Rule Management de Enterprise Designer. Si genera una regla en la herramienta Match Rule Management, esa regla podrá usarse en cualquier flujo de datos y también estará disponible para otros usuarios. Si genera una regla en alguna de las etapas de cruce, esa regla estará disponible solo para esa etapa, a menos que la guarde haciendo clic en el botón Guardar, con lo cual quedará disponible para otras etapas y usuarios.

  1. Abra Enterprise Designer.
  2. Realice una de estas acciones:
    • Si desea definir una regla de cruce en Interflow Match, Intraflow Match o Transactional Match, haga doble clic en la etapa de cruce para la que desea definir la regla. En el campo Cargar regla de cruce, seleccione una regla de cruce predefinida como punto de partida. Si desea empezar con una regla de cruce en blanco, haga clic en Nuevo.
    • Si desea definir una regla de cruce en la herramienta Administración de reglas de cruce, seleccione Herramientas > Administración de reglas de cruce. Si desea usar una regla ya existente como punto de partida para su regla, marque la casilla Copiar desde y seleccione la regla que va a usar como punto de partida.
  3. Especifique los campos de flujo de datos que desea usar en la regla de cruce, así como la jerarquía de regla de cruce.
    1. Haga clic en Agregar elemento principal.
    2. Ingrese un nombre para el elemento principal. El nombre debe ser único y no puede ser un campo. El primer elemento principal de la jerarquía se usa como nombre de la regla de cruce en el campo Cargar regla de cruce. Todas las reglas de coincidencia personalizadas que cree y las reglas predefinidas que modifique se guardan con la palabra “Custom” anexada al principio del nombre.
    3. Haga clic en Agregar elemento secundario. Aparecerá un menú desplegable en la jerarquía de regla. Seleccione un campo para agregarle al elemento principal.
      Nota: Todos los nodos secundarios de un nodo principal deben usar el mismo operador lógico. Si desea usar diferentes operadores lógicos para cada campo, primero deberá crear elementos principales intermedios.
    4. Repita el proceso hasta completar la jerarquía de comparación.
  4. Defina las opciones de los elementos principales. Las opciones para los elementos principales se muestran a la derecha de la jerarquía de regla cuando hay un nodo principal seleccionado.
    1. Haga clic en Coincidir cuando no sea verdadero para cambiar el operador lógico del elemento principal de Y a Y NO. Si selecciona esta opción, los registros solo coincidirán si no coinciden con la lógica definida en este elemento principal.
      Nota: Comprobar la opción Coincidir cuando no sea verdadero tiene el efecto de negar las opciones del Método de comparación. Para obtener más información, consulte Condiciones de cruce negativas.
    2. En el campo Método de comparación especifique cómo determinar si un elemento principal presenta un cruce o no. Una de las siguientes:
      Todo verdadero
      Se considera que un elemento principal es un cruce si todos los elementos secundarios están determinados para el cruce. Este método crea un conector "AND" entre los elementos secundarios.
      Cualquier elemento verdadero
      Se considera que un elemento principal es un cruce si al menos uno de los elementos secundarios está determinado para el cruce. Este método crea un conector "OR" entre los elementos secundarios.
      Según el umbral
      Se considera que un elemento principal es un cruce si la calificación del elemento principal es mayor o igual que el umbral del elemento principal. Cuando selecciona esta opción, aparece la barra deslizante Umbral . Utilice esta barra deslizante para especificar un umbral. El método de calificación determina qué conector lógico utilizar. Los umbrales del elemento principal no pueden ser mayores que el umbral de los elementos secundarios.
      Nota: El umbral que se configura aquí puede invalidarse durante la ejecución en el cuadro de diálogo Opciones de flujo de datos. Vaya a Editar > Opciones de flujo de datos y haga clic en Agregar. Expanda la etapa, haga clic en Umbral de nivel superior e ingrese el umbral en el campo Valor predeterminado.
    3. En el campo Datos faltantes especifique cómo calificar los campos vacíos. Una de las siguientes:
      Ignorar espacios en blanco
      Ignora el campo si está vacío.
      Contar como 0
      Asigna al campo una calificación de 0 si está vacío.
      Contar como 100
      Asigna al campo una calificación de 100 si está vacío.
      Comparar espacios en blanco

      Otorga campos sospechosos y candidatos como 100 si ambos contienen datos en blanco; de otro modo, otorga campos sospechosos y candidatos como 0.

    4. En el campo Método de calificación seleccione el método utilizado para determinar la calificación de comparación. Una de las siguientes:
      Promedio ponderado
      Utiliza el peso de cada elemento secundario para determinar la calificación de cruce promedio.
      Promedio
      Utiliza la calificación promedio de cada elemento secundario para determinar la calificación del elemento principal.
      Máximo
      Utiliza la calificación más alta de los elementos secundarios para determinar la calificación del elemento principal.
      Mínimo
      Utiliza la calificación más baja de los elementos secundarios para determinar la calificación del elemento principal.
      Suma total del vector
      Utiliza la suma total del vector de cada elemento secundario para determinar la calificación del elemento principal. La fórmula para realizar el cálculo es:

      sqrt(a^2 + b^2 + c^2) / sqrt(n), donde: a, b y c son las calificaciones de los tres elementos secundarios y n es la cantidad de elementos secundarios.

      La siguiente tabla muestra la relación lógica existente entre los métodos de comparación y los métodos de calificación, y cómo cada combinación cambia la lógica utilizada durante el proceso de cruce.

      Tabla 1. Matriz del método de comparación y el método de calificación
      Método de calificación Método de comparación Comentarios
      Cualquier elemento verdadero Todo verdadero Según el umbral
      Promedio ponderado N/A AND AND Disponible solamente cuando se seleccionan como método de comparación Todo verdadero o Según el umbral.
      Promedio N/A AND AND
      Suma total del vector N/A AND AND
      Máximo OR N/A OR Disponible solamente cuando se seleccionan como método de comparación Cualquier elemento verdadero o Según el umbral.
      Mínimo OR N/A OR
  5. Defina las opciones de los elementos secundarios. Las opciones para los elementos secundarios se muestran a la derecha de la jerarquía de regla cuando hay un elemento secundario seleccionado.
    1. Marque la opción Campo del candidato para asignar el campo del registro secundario seleccionado al campo en el archivo de entrada.
    2. Verifique la opción Comparar de forma cruzada con y seleccione uno o más elementos de la lista desplegable para comparar diferentes entre dos registros. Si están utilizando la herramienta Administración de reglas de coincidencia para crear o editar una regla de coincidencia, no habrá lista desplegable sino que deberá ingresar cada nombre de campo, separado por comas.
    3. Haga clic en Coincidir cuando no sea verdadero para cambiar el operador lógico de Y a NO. Si selecciona esta opción, la regla de cruce solo evaluará como verdadero si los registros no coinciden con la lógica definida en este elemento secundario.

      Por ejemplo, si desea identificar individuos que están asociados a múltiples cuentas, podría crear una regla de cruce que coincida con el nombre pero que no coincida con el número de cuenta. Utilizaría la opción Coincidir cuando no sea verdadero para el elemento secundario que no coincide con el número de cuenta.

    4. En el campo Datos faltantes especifique cómo calificar los campos vacíos. Una de las siguientes:
      Ignorar espacios en blanco
      Ignora el campo si está vacío.
      Contar como 0
      Asigna al campo una calificación de 0 si está vacío.
      Contar como 100
      Asigna al campo una calificación de 100 si está vacío.
      Comparar espacios en blanco

      Otorga campos sospechosos y candidatos como 100 si ambos contienen datos en blanco; de otro modo, otorga campos sospechosos y candidatos como 0.

    5. En el campo Umbral, especifique el umbral cuyo criterio debe cumplirse a nivel del campo individual para que se determine que ese campo es un cruce.
    6. En el campo Método de calificación seleccione el método utilizado para determinar la calificación de comparación. Una de las siguientes:
      Promedio ponderado
      Utiliza el peso de cada algoritmo para determinar la calificación de cruce promedio.
      Promedio
      Utiliza la calificación promedio de cada algoritmo para determinar la calificación de cruce.
      Máximo
      Utiliza la calificación más alta de los algoritmos para determinar la calificación de cruce.
      Mínimo
      Utiliza la calificación más baja de los algoritmos para determinar la calificación de cruce.
      Suma total del vector
      Utiliza la suma total del vector de la calificación de cada algoritmo para determinar la calificación de cruce. Este método de calificación es útil si desea que una calificación de cruce mayor en uno o más algoritmos se represente proporcionalmente en la calificación de cruce final. La fórmula utilizada para calcular la calificación final es:

      sqrt(a^2 + b^2 + c^2) / sqrt(n), donde: a, b y c son las calificaciones de tres algoritmos diferentes y n es la cantidad de algoritmos utilizados.

    7. Elija uno o más algoritmos que se utilizarán para determinar si los valores del campo constituyen un cruce.
      Para obtener más información, consulte Algoritmos para determinar los valores de comparación.
  6. Si define una regla en Interflow Match, Intraflow Match o Transactional Match y desea compartirla con otras etapas o usuarios, haga clic en el botón Guardar ubicado en la parte superior de la pantalla.