Creación de claves de cruce - discovery - 23.1

Guía de Spectrum Discovery

Product type
Portfolio
Verify
Product family
Spectrum
Product
Spectrum > Discovery
Version
23.1
Language
Español (México)
Product name
Spectrum Discovery
Title
Guía de Spectrum Discovery
First publish date
2007

Una clave de cruce es una clave no exclusiva compartida por registros similares que identifican registros como posibles duplicados. Esta facilita el proceso de cruce porque solo compara los registros que contienen la misma clave de cruce. Con la función de Clave de cruce, puede hacer lo siguiente:

  • Publicar una clave de cruce: sirve para publicar una clave de cruce en el repositorio a fin de reutilizarla en otro momento.
  • Acceder a la vista previa de una clave de cruce: se puede acceder a la vista previa de la clave de cruce con los Datos de entrada y el Resultado en la parte inferior de la página para evitar posibles errores.

Ejemplo

Tenga en cuenta la entrada según lo que se especifica debajo:
  • Primer nombre: Fred
  • Apellido: Mertz
  • Código de género: M
    Con la entrada anterior, si debe definir una regla de clave de cruce con la que se genere una clave de cruce mediante la combinación de datos del registro que se muestra a continuación, la clave de cruce será MertzFredM.
    Campo de entrada Posición de inicio Longitud
    Apellido 1 5
    Nombre 1 5
    Código de género 1 1
Para crear una regla de cruce, siga estos pasos:
  1. En la página Detalles de la fuente, haga clic en el botón Crear clave de cruce.
    Se abrirá la página Clave de cruce.
  2. En la página Clave de cruce, ingrese un nombre único para la clave de cruce en el campo Nombre de clave de cruce.
  3. A fin de definir la regla para la clave de cruce, seleccione Agregar.
    Verá el panel Opciones de la regla en la esquina derecha de la página.
  4. En el panel Opciones de la regla, configure estas opciones:
    Opción Descripción
    Algoritmo
    Consonante
    Devuelve campo especificados sin consonantes.
    Double Metaphone
    Devuelve un código basado en una representación fonética de sus caracteres. Double Metaphone es una versión mejorada del algoritmo de Metaphone que intenta explicar la gran cantidad de irregularidades detectadas en distintos idiomas.
    Koeln
    Indexa los nombres por sonido, tal como se los pronuncia en alemán. Permite que los nombres que tienen la misma pronunciación se codifiquen en Koeln con la misma representación, de modo tal que puedan cruzarse a pesar de las pequeñas diferencias en su escritura. El resultado es siempre una secuencia de números; los caracteres especiales y los espacios en blanco se ignoran. Esta opción se desarrolló como respuesta a las limitaciones de Soundex.
    MD5
    Es un algoritmo de síntesis de mensajes que produce un valor hash de 128 bits que se utiliza para comprobar la integridad de los datos.
    Metaphone
    Devuelve una clave codificada de Metaphone de los campos seleccionados. Metaphone es un algoritmo para codificar palabras utilizando su pronunciación del inglés.
    Metaphone (español)
    Devuelve una clave codificada de Metaphone de los campos seleccionados para el idioma español. El algoritmo de Metaphone codifica palabras con su pronunciación en español.
    Metaphone3
    Mejora gracias a los algoritmos de Metaphone y Double Metaphone con ajustes de Metaphone3 más exactos de consonantes y vocales internas, lo que permite pronunciar palabras y nombres que, a nivel fonético, se cruzan en mayor o menor medida con los términos de búsqueda. Metaphone3 aumenta la precisión de la codificación fonética en un 98 %. Esta opción se desarrolló como respuesta a las limitaciones de Soundex.
    Nysiis
    Es un algoritmo de codificación fonética que establece cruces entre una pronunciación aproximada con la escritura exacta de una palabra e indexa palabras de Nysiis que se pronuncian de manera similar. Forma parte del Sistema de Inteligencia e Identificación del Estado de Nueva York. Por ejemplo, supongamos que está buscando información sobre alguien en una base de datos de personas. Usted cree que el nombre de esa persona suena algo así como “John Smith”, pero se escribe “Jon Smyth”. Si busca un cruce exacto para “John Smith” no obtendrá resultados. Sin embargo, si indexa la base de datos con el algoritmo de NYSIIS y realiza la búsqueda usando ese mismo algoritmo, obtendrá una coincidencia correcta porque el algoritmo indexa "John Smith" y "Jon Smyth" como "JAN SNATH".
    Phonix
    Preprocesa cadenas de nombres mediante la aplicación de más de 100 reglas de transformación a caracteres únicos o secuencias de varios caracteres. Diecinueve de esas reglas se aplican solo si los caracteres se encuentran al comienzo de la cadena, mientras que 12 de estas se aplican si se encuentran en medio de la cadena, y 28 se aplican si están al final de la cadena. La cadena de nombre transformada se codifica en un código compuesto por la primera letra seguida de tres dígitos (sin ceros ni números duplicados). Esta opción se desarrolló como respuesta a las limitaciones de Soundex; es más compleja y, por lo tanto, más lenta que esta última.
    Sonnex
    Este algoritmo determina la similitud entre 2 cadenas en francés según la representación fonética de sus caracteres. Devuelve una clave codificada de Sonnex de los campos seleccionados.
    Soundex
    Devuelve un código de Soundex de los campos seleccionados. El algoritmo Soundex produce un código de longitud fija basado en la pronunciación en inglés de las palabras.
    Subcadena de caracteres
    Devuelve una porción específica del campo seleccionado.
    Nombre de campo Seleccione el campo en el que desea aplicar el algoritmo seleccionado. Por ejemplo, si selecciona LastName y elige el algoritmo SubString, se aplicará ese algoritmo SubString a los datos del campo LastName a fin de generar una clave de cruce.
    Posición de inicio Seleccione la posición inicial dentro del campo especificado.
    Nota: Solo puede seleccionar una posición inicial si elige el algoritmo SubString.
    Longitud Seleccione la longitud, expresada en caracteres, que desea incluir desde la posición inicial.
    Nota: Solo puede seleccionar una longitud si elige el algoritmo SubString.
    Opciones de preprocesamiento
    Eliminar carácter irrelevante
    Elimina todos los caracteres que no son numéricos ni alfabéticos, como los guiones, los espacios en blanco y otros caracteres especiales de un campo de entrada.
    Ordenar entrada
    Sirve para ordenar de forma alfabética todos los caracteres o términos de un campo de entrada.
    • Caracteres: sirve para ordenar los valores de los caracteres de un campo de entrada antes de crear un ID único:
    • Términos: sirve para ordenar el valor de cada término de un campo de entrada antes de crear un ID único.
    Nota: Solo puede seleccionar la función de ordenar entrada si elige el algoritmo Consonant o SubString.
  5. Seleccione Aceptar.
    Ahora puede guardar o publicar la clave de cruce. Para obtener más información, consulte Cómo guardar y publicar la clave de cruce.