Introducción a Data Quality - spectrum_quality_1 - 23.1

Guía de Spectrum Data Quality

Product type
Portfolio
Verify
Product family
Spectrum
Product
Spectrum > Quality > Spectrum Quality
Version
23.1
Language
Español (México)
Product name
Spectrum Data Quality
Title
Guía de Spectrum Data Quality
First publish date
2007
Last updated
2024-02-07
Published on
2024-02-07T17:21:06.785000

Data Quality implica garantizar la exactitud, puntualidad, integridad y consistencia de los datos utilizados por una organización, de modo tal que dichos datos son aptos para usarse. Spectrum Technology Platform respalda las iniciativas de calidad de datos al proporcionar las siguientes capacidades.

Análisis

El análisis es el proceso a través del cual se evalúa una secuencia de caracteres de entrada en un campo y se disemina en varios campos. Por ejemplo, puede haber un campo denominado Nombre que contenga el valor “John A. Smith” y, mediante el análisis, descomponerlo para que el campo FirstName contenga “John”, un campo MiddleName que contenga “A” y un campo LastName con “Smith”.

Estandarización

Normalización toma datos del mismo tipo y los pone en el mismo formato. Algunos tipos de datos que pueden normalizarse incluyen números telefónicos, fechas, nombres, direcciones y números identificatorios. Por ejemplo, los números telefónicos pueden formatearse de manera tal que se eliminen los caracteres no numéricos tales como paréntesis, puntos o guiones.

Es recomendable que realice la normalización de sus datos antes de realizar actividades de cruce o de desduplicación, puesto que los datos normalizados experimentarán cruces más exactos que los datos con inconsistencias en su formato.

Comparación

El cruce es el proceso de identificar registros relacionados entre sí en cierta forma que tenga significado para sus propósitos. Por ejemplo, si intenta eliminar información redundante de los datos de su cliente, puede que desee identificar los registros duplicados de dicho cliente; o, si intenta evitar que el mismo material de marketing se envíe dos veces a la misma dirección, es posible que desee identificar los registros de clientes que habitan en el mismo hogar.

Desduplicación

La desduplicación identifica registros que representan a una entidad, pero que por alguna razón fueron ingresados varias veces en el sistema, en ocasiones con datos con leves diferencias. Por ejemplo, su sistema puede contener información de proveedores de distintos departamentos de su organización, usando cada departamento, para el mismo proveedor, una Id. de proveedor diferente. Al usar Spectrum Technology Platform puede consolidar esos registros en un único registro de cada proveedor.

Revisión de registros de excepción

En ciertos casos es posible que cuente con datos que no pueden procesarse automáticamente de manera confidencial y que deben ser revisados por un administrador de datos que esté informado. Algunos ejemplos de registros que pueden requerir de revisión manual incluyen los siguientes:
  • Fallas en la verificación de direcciones
  • Fallas de geocodificación
  • Cruces con bajo nivel de confianza
  • Decisiones de combinación/consolidación

Data Stewardship Portal contiene funciones con las que puede identificar y resolver registros de excepción.