Spectrum Data Normalization examina los términos de un registro y determina si el término está en el formato preferido.
Componentes
Spectrum Data Normalization consta de las siguientes etapas:
- Advanced Transformer: en esta etapa se exploran y se dividen las cadenas de datos en múltiples campos, además de colocar los datos extraídos y sin extraer en un campo existente o nuevo.
- Open Parser: esta etapa analiza los datos de entrada de múltiples culturas de todo el mundo por medio de una gramática de análisis simple pero eficaz. Esta gramática permite definir una secuencia de expresiones que representan patrones de dominio para analizar los datos de entrada. Open Parser también recopila datos estadísticos y otorga calificaciones a los cruces de análisis para ayudar a determinar la efectividad de las gramáticas de análisis utilizadas.
- Table Lookup: esta etapa evalúa un término y lo compara con un formato previamente validado de ese término. Si el término no está en el formato adecuado, es reemplazado por su versión estándar. Las funciones de Table Lookup incluyen el cambio de palabras completas a abreviaturas y viceversa, el cambio de apodos a nombres completos o la corrección de palabras mal escritas.
- Transliterator: convierte una cadena de un alfabeto a otro, como del latín al árabe o del árabe al latín.