Data Quality implica garantizar la exactitud, puntualidad, integridad y consistencia de los datos utilizados por una organización, de modo tal que dichos datos son aptos para usarse. Spectrum Technology Platform respalda las iniciativas de calidad de datos al proporcionar las siguientes capacidades.
Análisis
El análisis es el proceso a través del cual se evalúa una secuencia de caracteres de entrada en un campo y se disemina en varios campos. Por ejemplo, puede haber un campo denominado Nombre que contenga el valor “John A. Smith” y, mediante el análisis, descomponerlo para que el campo FirstName contenga “John”, un campo MiddleName que contenga “A” y un campo LastName con “Smith”.
Estandarización
Normalización toma datos del mismo tipo y los pone en el mismo formato. Algunos tipos de datos que pueden normalizarse incluyen números telefónicos, fechas, nombres, direcciones y números identificatorios. Por ejemplo, los números telefónicos pueden formatearse de manera tal que se eliminen los caracteres no numéricos tales como paréntesis, puntos o guiones.
Es recomendable que realice la normalización de sus datos antes de realizar actividades de cruce o de desduplicación, puesto que los datos normalizados experimentarán cruces más exactos que los datos con inconsistencias en su formato.
Comparación
El cruce es el proceso de identificar registros relacionados entre sí en cierta forma que tenga significado para sus propósitos. Por ejemplo, si intenta eliminar información redundante de los datos de su cliente, puede que desee identificar los registros duplicados de dicho cliente; o, si intenta evitar que el mismo material de marketing se envíe dos veces a la misma dirección, es posible que desee identificar los registros de clientes que habitan en el mismo hogar.
Desduplicación
La desduplicación identifica registros que representan a una entidad, pero que por alguna razón fueron ingresados varias veces en el sistema, en ocasiones con datos con leves diferencias. Por ejemplo, su sistema puede contener información de proveedores de distintos departamentos de su organización, usando cada departamento, para el mismo proveedor, una Id. de proveedor diferente. Al usar Spectrum Technology Platform puede consolidar esos registros en un único registro de cada proveedor.
Revisión de registros de excepción
- Fallas en la verificación de direcciones
- Fallas de geocodificación
- Cruces con bajo nivel de confianza
- Decisiones de combinación/consolidación
Data Stewardship Portal contiene funciones con las que puede identificar y resolver registros de excepción.