Detalles de tabla en Resultados de generación de perfiles - discovery - 23.1

Guía de Spectrum Discovery

Product type
Portfolio
Verify
Product family
Spectrum
Product
Spectrum > Discovery
Version
23.1
Language
Español (México)
Product name
Spectrum Discovery
Title
Guía de Spectrum Discovery
First publish date
2007
Haga clic en cualquiera de los nombres de tabla en el panel izquierdo para ver estos detalles:
  • Nivel de finalización: es el porcentaje de filas completas e incompletas detectadas en los datos perfilados.
    Nota: Haga clic en el hipervínculo Filas incompletas y Filas completas para ver los registros de ambas categorías.
  • Resumen de tabla: aparecen en él los detalles de cada columna en la tabla
    • Nombre de columna: nombres de todas las columnas en la tabla
    • Tipo de datos: el tipo de datos de la columna
    • Finalización (%): finalización de registros en la columna
    • Singularidad: singularidad de los datos presentes en la columna
    • Tipo detectado: muestra los tipos de semántica, como correo electrónico, teléfono, ciudad, nombre y apellido detectados en la cadena de esta columna.
    • Otras estadísticas: se muestran otras estadísticas como Longitud mínima, Longitud máxima y Patrones de texto
  • Frecuencia de recuento nula: muestra el número de valores nulos en cada fila de la tabla

Visualización de valores atípicos

Puede hacer clic en la pestaña Análisis de valor atípico para ver un resumen de los valores atípicos detectados en cada columna. En esta pestaña, se muestran las ocurrencias basadas en categorías de cualquier patrón, valor, longitud o frecuencia para una columna que no está en el rango de otras observaciones.

Por ejemplo, la longitud permitida para el Nombre del país es hasta 14 caracteres y se detectan cadenas de 15 caracteres en sus datos; esta cadena de caracteres se categorizará en Valores atípicos de longitud. Las categorías admitidas son Valores atípicos de longitud, Valores atípicos de frecuencia, Valores atípicos de patrón de texto, Valores atípicos numéricos, Valores atípicos de tipo semántico y Valores atípicos de tipo de datos.

Visualización de registros malformados

En la generación de perfiles de Archivos sin formato, puede ver los registros erróneos de la tabla si hace clic en la ficha Registros erróneos. En la pestaña, se muestran la Categoría y el Recuento de los registros malformados. Un registro se designa como malformado debido a las siguientes categorías:
  • Filas con una cantidad de campos menor que la cantidad de columnas definidas
  • Filas con una cantidad de campos mayor que la cantidad de columnas definidas

    También puede hacer clic en Categoría para mostrar una vista previa de los registros malformados. En la vista previa, se muestran el Número de registro, el Registro y la Razón para categorizar el registro como malformado.

Visualización de registros duplicados

Haga clic en la ficha Análisis de registros duplicados para ver un resumen de los registros duplicados detectados en la tabla.

En la ficha Análisis de registros duplicados, también se ofrece la capacidad de resolver los registros duplicados determinados en los datos si hace clic en el botón Resolver duplicados. Si hace clic, se lo dirige a la página de creación de reglas inteligentes del módulo Preparar, donde puede seleccionar aún más las columnas de los datos para resolver los duplicados. Para obtener más información sobre cómo crear reglas inteligentes, consulte Preparación de reglas de calidad.
Nota: Solo se admite una fuente de datos de tipo Archivo sin formato o Conexión para resolver los duplicados. En el caso de una fuente de datos de tipo modelo, verá un error si hace clic en el botón Resolver duplicados.