Estandarización de nombres personales - spectrum_quality_1 - 23.1

Guía de Spectrum Data Quality

Product type
Portfolio
Verify
Product family
Spectrum
Product
Spectrum > Quality > Spectrum Quality
Version
23.1
Language
Español (México)
Product name
Spectrum Data Quality
Title
Guía de Spectrum Data Quality
First publish date
2007
Last updated
2024-02-07
Published on
2024-02-07T17:21:06.785000

Este ejemplo muestra cómo crear un flujo de datos que tome los datos de nombres personales (por ejemplo, "John P. Smith"), identificar apodos comunes del mismo nombre y crear una versión estándar del nombre que pueda usarse para consolidar registros redundantes.

Nota: Antes de comenzar, cerciórese de que sus datos de entrada tengan un campo denominado "Nombre" que contenga el nombre completo de la persona.
  1. Si aún no lo ha hecho, cargue las siguientes tablas en el servidor Spectrum Technology Platform:
    • Base de Open Parser
    • Nombres mejorados de Open Parser

    Use la utilidad de carga de bases de datos de Data Normalization para cargar estas tablas. Para obtener instrucciones sobre la carga de tablas, consulte la Guía de instalación.

  2. Genere un nuevo flujo de datos en Enterprise Designer.
  3. Arrastre hacia el lienzo una etapa de origen.
  4. Haga doble clic en la etapa de origen y configúrela. Consulte la Guía de Dataflow Designer para obtener instrucciones acerca de cómo configurar etapas de origen.
  5. Arrastre hacia el lienzo una etapa Open Name Parser y conéctela a la etapa de origen.

    Por ejemplo, si está utilizando la etapa Read from File, su flujo de datos tendrá el siguiente aspecto:

    Read from File en flujos de datos
  6. Arrastre hacia el lienzo la etapa Table Lookup y conéctela a la etapa Open Name Parser.

    Su flujo de datos debería tener ahora el siguiente aspecto:

    Open Name Parser se conecta a Table Lookup, que está conectada al flujo de datos.
  7. Haga doble clic en la etapa Table Lookup en el lienzo.
  8. En el campo Origen, seleccione FirstName.
  9. En el campo Destino, seleccione FirstName.

    Al especificar el mismo campo tanto como origen y como destino, el campo se actualizará con la versión normalizada del nombre.

  10. En el campo Tabla, seleccione NickNames.xml.
  11. Haga clic en Aceptar.
  12. Haga clic otra vez en Aceptar para cerrar la ventana de Opciones de Table Lookup.
  13. Arrastre hacia el lienzo una etapa receptora y conéctela a la etapa Table Lookup.

    Por ejemplo, si estuviera utilizando una etapa receptora Write to File, su flujo de datos tendría ahora el siguiente aspecto:

    Write to File en flujos de datos
  14. Haga doble clic en la etapa receptora y configúrela. Consulte la Guía de Dataflow Designer para obtener instrucciones acerca de cómo configurar etapas de origen.

Ahora tiene un flujo de datos que toma nombres de personas y normaliza los nombres de pila, reemplazando los apodos con la forma normalizada del nombre.