Detalles de columna en Resultados de generación de perfiles - discovery - 23.1

Guía de Spectrum Discovery

Product type
Portfolio
Verify
Product family
Spectrum
Product
Spectrum > Discovery
Version
23.1
Language
Español (México)
Product name
Spectrum Discovery
Title
Guía de Spectrum Discovery
First publish date
2007
Según la columna en la que haga clic ubicada en el panel izquierdo de la página Resultados de la generación de perfiles de datos, se mostrarán los siguientes detalles:
Nota: Las categorías de los gráficos de anillo y los valores de los ejes X e Y de los gráficos poseen hipervínculos. Si hace clic en los enlaces, accederá a la lista asociada de registros.
  • Nivel de finalización: el porcentaje de cadenas de caracteres Finalizadas, Nulas y Vacías detectadas en la columna. Haga clic en el hipervínculo para ver los registros de cada categoría.
  • Singularidad: aquí se muestran estas estadísticas:
    • Únicos: registros sin duplicados en la fuente de datos.
    • No únicos: registros que tienen duplicados en la fuente de datos.
    • Distintos: una lista de todos los registros presentes en su fuente de datos, independientemente de si son registros únicos o no únicos.

    Por ejemplo, su columna contiene estos nombres:

    Roger Gigi Gigi Gigi Garey Elena Brad Brad
    Aquí:
    • Roger, Garey y Elena son registros únicos.

    • Gigi y Brad son registros no únicos.
    • Roger, Gigi, Garey, Brad y Elena son registros distintos.
  • Longitud mín. y Longitud máx. de caracteres en caso de que los datos de la columna sean una cadena.
  • Desviación estándar (Stdev), Máximo (Max), Mínimo (Min), Varianza y valor Promedio en caso de que la columna tenga datos numéricos.
  • Histograma permite representar la distribución de datos en caso de que la columna tenga datos numéricos
  • Percentil en caso de que la columna tenga datos numéricos
  • Frecuencia de los datos en la columna. Haga clic en el valor que posee el hipervínculo en el eje X para ir a la lista de registros asociados.
  • Longitudes de cadenas en caso de que el tipo de datos de la columna sea una cadena de caracteres
  • Distribución de secuencias de comando en caso de que el tipo de datos de la columna sea una cadena de caracteres
  • Frecuencia de patrón de texto en caso de que el tipo de datos de la columna sea una cadena de caracteres
  • Categorías de caracteres: permite mostrar gráficamente las frecuencias de los tipos de caracteres latinos detectados en la columna de cadena de caracteres seleccionada. Las distintas categorías son:
    • Uso de mayúsculas y minúsculas: letras mayúsculas, minúsculas y combinadas
    • Tipos de datos de caracteres: alfabético, numérico y alfanumérico
    • Contiene espacios: espacios únicos, múltiples y espacios ubicados al principio y al final
    • Caracteres especiales: caracteres especiales existentes o no existentes.
      Nota: En estas categorías solo se considerarán los caracteres especiales definidos durante la configuración de la regla Análisis de caracteres.

Visualización de valores atípicos

Puede hacer clic en la pestaña Valores atípicos para ver los valores atípicos detectados en una columna. Esta pestaña muestra una estructura con tabulación de valores atípicos detectados por categoría en la columna. También se muestra detalles como Patrón, Longitud, Valor o Frecuencia, Rango calculado y Ocurrencia.

Ver la página de sugerencias

Esta página muestra una visión completa de las sugerencias generadas para sus datos. Puede escoger seleccionar estas sugerencias para depurar sus datos.

Esta página se divide en dos partes:

  • Un encabezado en el que aparecen los detalles del perfil. Se muestran los siguientes detalles del perfil analizado:
    • Nombre de perfil: nombre del perfil
    • Descripción: una breve descripción del perfil
    • Iniciado: la fecha (aaaa/mm/dd), hora (hh:mm:ss) y período (a. m. o p. m.) del momento en que se inició el análisis del perfil.
    • Origen de datos: el origen de los datos en el perfil que se está analizando. Puede ser un modelo físico o lógico, o bien una conexión de origen de datos.
    • Usuario: el usuario que creó el perfil
    • Tablas: cantidad de tablas en el modelo seleccionado
    • Tipo de fuente de datos: permite indicar si la fuente de datos del perfil es un modelo o una base de datos
    • Registros: cantidad total de registros analizados
    • Botón Estadísticas: lo guía por la página Resultados de la generación de perfiles de datos. Para obtener más información, consulte Ver sugerencias en la página Resultados de la generación de perfiles de datos.
  • La segunda sección muestra el nombre de la tabla junto al botón Recomendación. Tras hacer clic en este botón, se muestran Comandos Groovy de sugerencias para su tabla. Cuando expanda la tabla usando el ícono , podrá ver sugerencias relacionadas con las columnas para su tabla.
Se muestran detalles como las Sugerencias y sus correspondientes Descripciones en un formato de tabla de varias columnas para las que se generaron acciones de sugerencias. Con el botón Ver detalles, se muestra una vista previa de las estadísticas y las opciones de los datos. Haga clic en el botón Seleccionar sugerencia para optar por seleccionar cualquier sugerencia o haga clic en el botón Quitar sugerencia para quitar una que ya se haya aplicado. El ícono indica la selección exitosa de una sugerencia. Puede elegir ver y copiar los comandos groovy de cualquier sugerencia en particular haciendo clic en el botón de Recomendación correspondiente.
Nota: Para descargar y copiar los Comandos Groovy de todas las columnas de una tabla específica para la que se han seleccionado sugerencias, haga clic en el botón Recomendación ubicado junto al nombre de tabla. Tras hacer clic en este botón, se mostrará una ventana de Recomendación que muestra detalles como el nombre de tabla, el nombre de columna y las sugerencias generadas seguidas de comandos groovy.

Puede ver y seleccionar sugerencias para estadísticas independientes en la página Resultados de la generación de perfiles de datos. Analice las estadísticas de sus datos y seleccione cualquier sugerencia según sus requisitos. Para obtener más información, consulte Ver sugerencias en la página Resultados de la generación de perfiles de datos.

Ver sugerencias en la página Resultados de la generación de perfiles de datos

Puede ver las sugerencias brindadas para depurar sus datos. Estas sugerencias se generan según las estadísticas de sus datos. Puede seleccionarlas. Haga clic en el botón Sugerencias para abrir una nueva ventana emergente que muestra sugerencias. Puede moverse a la siguiente sugerencia haciendo clic en el ícono .
Nota: Para ver los datos transformados después de seleccionar una opción para cualquier sugerencia, haga clic en el ícono . Si desea seleccionar la sugerencia, haga clic en el botón Seleccionar sugerencia. Se mostrará un mensaje que indica que la sugerencia se seleccionó correctamente.

Sugerencias para la pestaña Resumen

En Categorías de caracteres, podrá ver cualquiera de estas sugerencias basadas en sus datos:
  • Tipo de datos de caracteres: los tipos de datos de caracteres, como los numéricos, alfanuméricos y alfabéticos detectados en los datos se muestran en un formato de tabla con sus frecuencias. En la lista de opciones puede seleccionar Recortar o Eliminar estos valores, o establecer un valor predeterminado. Debe especificar este valor en el cuadro de texto que aparece al seleccionar esta opción.
  • Borrar espacios: los espacios redundantes, como los espacios únicos, espacios múltiples y espacios ubicados al principio y al final que se encuentran en los datos se muestran en un formato de tabla con sus frecuencias. Puede elegir cualquiera de estas opciones según sus necesidades:
    • Recortar espacios: esta opción quitará cualquier espacio ubicado al principio o al final que se encuentre en sus datos.
    • Minimizar espacio en blanco: esta opción quitará los espacios redundantes entre dos palabras y también los espacios ubicados al principio y al final
    • Quitar espacios: esta opción quitará todos los espacios que se encuentren en sus datos.
  • Estandarizar uso de mayúsculas y minúsculas: con esta opción, los datos se pueden regularizar mediante la estandarización del uso de mayúsculas y minúsculas, como Mayúscula y minúscula combinadas, Mayúsculas y Minúsculas. Puede optar por cambiar el uso de mayúsculas y minúsculas de los datos a Minúsculas o Mayúsculas, con lo que depurará los datos y mejorará su uniformidad y legibilidad.
  • Quitar caracteres especiales: mediante esta opción puede elegir quitar cualquier carácter especial que se encuentre en sus datos. Los caracteres especiales detectados se muestran en la sección Opciones en un cuadro de texto. Para depurar sus datos, puede seleccionar los caracteres especiales que desea quitar, y eliminar los caracteres que desea mantener mediante la tecla de retroceso en el cuadro de texto.
  • Quitar caracteres de control: mediante esta opción, puede quitar cualquier carácter de control redundante y no imprimible que se encuentre en sus datos. Los caracteres de control detectados en los datos aparecen en la sección Estadísticas; seleccione la opción Borrar caracteres de control y aplique esta sugerencia para seguir depurando los datos.
En el caso de Singularidad, verá la siguiente sugerencia:

Crear tipo de semántica: los distintos datos se pueden categorizar en un tipo de semántica, como Género, Nombre, Apellido, País y Teléfono. Haga clic en el gráfico de estadísticas de los datos distintos para mostrar una vista previa de sus datos. Descargue estos datos y cree tipos de semántica mediante Administración de tablas. Para obtener más información acerca de Administración de tablas, consulte Introducción a las tablas de búsqueda.

En el caso de Finalización, verá la siguiente sugerencia:

Manejo de valores nulos: puede establecer las cadenas nulas y vacías que se encuentran en los datos en un valor predeterminado. Esto aumenta la uniformidad y finalización de sus datos. Las frecuencias de las cadenas Completas, Nulas y Vacías aparecen en formato de tabla en la sección Estadísticas. Ingrese el valor predeterminado que desea en el cuadro de texto Opciones y seleccione esta sugerencia.

Sugerencias para la pestaña Resumen de fechas

En el caso de Patrones de datos, verá la siguiente sugerencia:

Estandarizar fecha: puede regular los formatos de las fechas presentes en sus datos para mejorar la uniformidad de sus datos. Las frecuencias de los varios formatos de fecha detectados en sus datos aparecen en formato de tabla. Seleccione el formato deseado en el menú desplegable de formato de fecha que se encuentra en la sección Opciones y seleccione esta sugerencia.

Sugerencias para la pestaña Patrón personalizado

En el caso de Patrones cruzados, verá la siguiente sugerencia:

Depuración de patrón: puede eliminar los valores en sus datos que no sigan el patrón personalizado especificado durante la configuración de un perfil. Para obtener más información acerca de los patrones personalizados, consulte Análisis de claves de una sola columna. La categoría con la frecuencia más alta se considera como referencia; las otras estadísticas se cruzan con esta. Puede seleccionar cualquiera de estas opciones para las estadísticas sin comparación:
  • Establecerlas en un valor predeterminado. Ingrese el valor predeterminado en el cuadro de texto proporcionado.
  • Establecerlas en un valor nulo

Después de seleccionar la opción deseada, seleccione esta sugerencia para depurar sus datos.

Sugerencias para la pestaña Valores atípicos

En el caso de Valores atípicos de tipo semántico, verá la siguiente sugerencia:

Tipos de semántica de segregación: puede trasladar valores atípicos de tipo semántico presentes en una columna a una columna independiente y mejorar la uniformidad y claridad de sus datos. La frecuencia de varios valores atípicos detectados en sus datos se muestra en un formato de tabla, puede mover cualquiera de estos valores atípicos detectados a una columna personalizada independiente y segregar los tipos de semántica.

Seleccione los valores atípicos que desea mover a una columna independiente, ingrese el nombre personalizado de la columna en el cuadro de texto y seleccione esta sugerencia.

Nota: Cuando cierre la ventana de sugerencias después de seleccionar correctamente una, aparecerá el mensaje emergente Mostrar recomendaciones. Cuando haga clic en , se lo dirigirá a la página Sugerencias. Puede copiar la secuencia de comandos groovy desde esta página para usarlos en Enterprise Designer. Para obtener más información, consulte Ver la página de sugerencias.