Opciones de Match Key Generator - dataflow_designer - spectrum_quality_1 - 23.1

Guía de Spectrum Data Quality

Product type
Portfolio
Verify
Product family
Spectrum
Product
Spectrum > Quality > Spectrum Quality
Version
23.1
Language
Español (México)
Product name
Spectrum Data Quality
Title
Guía de Spectrum Data Quality
First publish date
2007
Last updated
2024-02-07
Published on
2024-02-07T17:21:06.785000
Para definir las opciones de Match Key Generator (Generador de clave de cruce), haga clic en el botón Agregar. De esta forma, se abre el cuadro de diálogo Campo de clave de cruce.
Nota: La función Opciones de flujo de datos de Enterprise Designer permite que el generador de clave de cruce (Match Key Generator) esté expuesto para ser establecido al modo de tiempo de ejecución.

Si agrega muchos algoritmos de generación de claves de cruce, puede utilizar los botones Subir y Bajar para cambiar el orden en el que se aplican los algoritmos.

Algoritmo

Especifica uno de estos algoritmos a usar para generar la match key:

Consonante
Devuelve campo especificados con consonantes eliminadas.
Double Metaphone
Devuelve un código basado en una representación fonética de sus caracteres. Double Metaphone es una versión mejorada del algoritmo Metaphone e intenta explicar la gran cantidad de irregularidades encontradas en los distintos idiomas.
Koeln
Indexa los nombres por sonido, tal como se los pronuncia en alemán. Permite que los nombres que tienen la misma pronunciación se codifiquen con la misma representación, de modo tal que puedan cruzarse a pesar de las pequeñas diferencias en el modo en que se escriben. El resultado es siempre una secuencia de números; los caracteres especiales y los espacios en blanco se ignoran. Esta opción se desarrolló para responder a las limitaciones de Soundex.
MD5
Un algoritmo de síntesis del mensaje que produce un valor hash de 128 bits. Este algoritmo suele usarse para comprobar la integridad de los datos.
Metaphone
Devuelve una clave codificada Metaphone de campos seleccionados. Metaphone es un algoritmo para codificar palabras utilizando su pronunciación del inglés.
SpanishMetaphone
Devuelve una clave codificada Metaphone de campos seleccionados para el idioma español. El algoritmo Metaphone codifica palabras con base en su pronunciación en español.
Metaphone 3
Mejora los algoritmos de Metaphone y Double Metaphone con parámetros más exactos de consonantes y vocales internas que permiten pronunciar palabras y nombres que, fonéticamente, coinciden en mayor o menor medida con los términos de búsqueda. Metaphone 3 aumenta la precisión de la codificación fonética en un 98%. Esta opción se desarrolló para responder a las limitaciones de Soundex.
Nysiis
Algoritmo de codificación fonética que cruza una pronunciación aproximada con una palabra escrita exacta e indexa palabras que se pronuncian de manera similar. Parte del sistema de inteligencia e identificación del estado de Nueva York (New York State Identification and Intelligence System). Supongamos que está buscando información sobre alguien en una base de datos de personas. Cree que el nombre de esa persona suena algo así como "John Smith", pero en realidad se escribe "Jon Smyth". Si busca una coincidencia exacta para "John Smith" no obtendrá resultados. Sin embargo, si indexa la base de datos con el algoritmo de NYSIIS y realiza la búsqueda usando ese mismo algoritmo, obtendrá una coincidencia correcta porque el algoritmo indexa "John Smith" y "Jon Smyth" como "JAN SNATH".
Phonix
Sirve para procesar con anterioridad las cadenas de nombres mediante la aplicación de más de 100 reglas de transformación a caracteres únicos o a secuencias de varios caracteres. Diecinueve (19) de esas reglas se aplican solo si los caracteres se encuentran al comienzo de la cadena, mientras que 12 de ellas se aplican solo cuando los caracteres se encuentran en medio de la cadena, y 28 solo se aplican si están al final de la cadena. La cadena de nombre transformada se codifica en un código compuesto por la primera letra seguida de tres dígitos (sin ceros ni números duplicados). Esta opción se desarrolló como respuesta a las limitaciones de Soundex; es más compleja y, por lo tanto, más lenta que esta última.
Este algoritmo determina la similitud entre dos cadenas en francés según la representación fonética de sus caracteres.
Devuelve una clave codificada de Sonnex de los campos seleccionados.
Soundex
Devuelve un código Soundex de campos seleccionados. El algoritmo Soundex produce un código de longitud fija basado en la pronunciación en inglés de las palabras.
Subcadena de caracteres
Devuelve una porción específica del campo seleccionado.

Nombre de campo

Especifica el campo en el que desea aplicar el algoritmo seleccionado para generar la clave de cruce. Por ejemplo, si selecciona un campo denominado LastName y elije el algoritmo Soundex, se aplicará ese algoritmo a los datos del campo LastName para generar una clave de cruce.

Posición de inicio

Especifica la posición de inicio dentro del campo especificado. No todos los algoritmos permiten especificar una posición inicial.

Longitud

Especifica la longitud, en caracteres, por incluirse desde la posición inicial. No todos los algoritmos permiten especificar una longitud.

Quitar caracteres irrelevantes

Elimina los caracteres que no son numéricos ni alfabéticos, como los guiones, los espacios en blanco y otros caracteres especiales de un campo de entrada.

Ordenar entrada

Ordena alfabéticamente todos los caracteres de un campo de entrada o todos los términos de un campo de entrada.

Caracteres
Ordena los valores de los caracteres de un campo de entrada antes de crear una ID única:
Términos
Ordena el valor de cada término de un campo de entrada antes de crear una ID única.