Seleccionar columnas - discovery - 23.1

Guía de Spectrum Discovery

Product type
Portfolio
Verify
Product family
Spectrum
Product
Spectrum > Discovery
Version
23.1
Language
Español (México)
Product name
Spectrum Discovery
Title
Guía de Spectrum Discovery
First publish date
2007
En esta página, las columnas de los datos aparecen en formato de tabla. Debe seleccionar las columnas de los datos que deben participar en la capacitación del modelo y la creación de reglas de mejor de la especie, y así como los campos para los que desea que se combinen los datos.
  1. Seleccione la casilla de verificación Nombre de la columna para las columnas que deben participar en la creación de reglas de mejor de la especie.
  2. Si desea combinar un campo, alterne la opción Combinar a .
    Nota: Asegúrese de seleccionar siempre la casilla de verificación correspondiente del campo que desea combinar.
  3. Seleccione el tipo de semántica que desee del menú desplegable después de seleccionar la casilla de verificación correspondiente de esa columna. De manera predeterminada, se muestra NINGUNO.
Según las columnas seleccionadas, los grupos de registros se generan de forma automática y se muestran en la página siguiente para su etiquetado. Los grupos generados cubren todas las variaciones de los datos mediante técnicas y algoritmos avanzados e inteligentes. Por ejemplo, si el archivo de entrada original contiene 5000 grupos, el sistema podría mostrar solo 50 grupos que cubren todas las variaciones.
Nota: De forma predeterminada, el límite del tamaño máximo de la colección es de 10, y los grupos más grandes se excluyen del proceso de consolidación.

El propósito de generar variaciones es identificar un pequeño subconjunto de colecciones para el etiquetado, lo que cubre la mayoría de las variaciones únicas de los datos de fuente. Es como seleccionar algunas colecciones de un gran conjunto de colecciones que representan el conjunto completo a fin de que, mediante el etiquetado de este subconjunto, se proporcione la regla de mejor de su clase similar a la que habríamos obtenido si hubiéramos etiquetado todo el conjunto de la colección.

Las variaciones se generan en función de las operaciones que hay en la etapa Best Of Breed.
Operador BOB Basado en funciones
Más común Frecuencia
Más largo/más corto Longitud
Más alto/más bajo Rango
Mayor/menor que Valores absolutos
Igual/no igual a Se basa en encontrar los valores que son específicos de la categoría y utilizar los valores obtenidos como una función.
Vacío/no vacío Frecuencia
Nota: De forma predeterminada, el campo Número de colección, que es un campo obligatorio, se selecciona de forma automática y se desactiva. Con el número de colección, se identifica cada registro duplicado de una cola de cruce y, si el candidato es un duplicado, se le asigna un número de colección.