Mesures vous permet de spécifier la manière dont les données sont mesurées. Ceci est utilisé pour créer un rapport illustrant les types d'exceptions survenant dans vos données. Par exemple, si la condition est conçue pour évaluer l'intégralité d'un enregistrement (que toutes les adresses comprennent des codes postaux par exemple), vous pourrez alors utiliser « Intégralité » comme métrique de qualité de données.
Remarque : Les mesures que vous définissez ici serviront d'options par défaut à la fois pour les paramètres Data Stewardship et le stage Exception Monitor.
Vous pouvez choisir l'une des mesures prédéfinies ou définir votre propre mesure :
- Pour définir votre propre mesure, cliquez sur le bouton Ajouter un élément et configurez les options selon vos besoins.
- Pour modifier une mesure existante, sélectionnez-la, cliquez sur le bouton Modifier l'élément et apportez les modifications souhaitées.
- Pour supprimer une mesure, sélectionnez-la et cliquez sur le bouton Supprimer l'élément .
- Pour filtrer la liste des mesures, entrez des données de recherche dans le champ Filtre. La table se met à jour dynamiquement.
Les mesures prédéfinies suivantes sont disponibles au départ. Ces valeurs peuvent être modifiées selon les besoins.
- Accuracy—La condition vérifie si les données peuvent être comparées à une source de confiance pour vérification. Par exemple, si une adresse n'a pas pu être vérifiée en utilisant les données provenant d'une administration postale, elle pourrait être considérée comme étant une exception car elle manque de précision.
- Completeness—La condition vérifie s’il manque des attributs clés aux données. Par exemple, une adresse n'ayant pas de code postal, ou un compte n'ayant pas de nom de contact.
- Consistency—La condition vérifie si les données du système sont cohérentes entre différents systèmes. Par exemple, si votre système de données de clients utilisent les codes de sexe H et F, mais que les données que vous traitez ont les codes de sexe 0 et 1, les données pourraient être considérées comme ayant des problèmes de consistance.
- Interpretability—La condition vérifie si les données sont correctement décomposées selon une structure de données pouvant être interprétée par un autre système. Par exemple, les numéros de sécurité sociale ne devraient contenir que des données numériques. Si les données comportent des lettres,
xxx-xx-xxxx
par exemple, les données pourrait être considérées comme ayant des problèmes d'intelligibilité. - Recency—La condition vérifie si les données sont à jour. Par exemple, si une personne déménage mais que l'adresse que vous possédez dans votre système contient l'ancienne adresse de cette personne, les données pourraient être considérées comme ayant un problème concernant leur caractère peu récent.
- Uncategorized—Sélectionnez cette option si vous ne souhaitez pas catégoriser cette condition.
- Uniqueness—La condition vérifie s’il existe des données doublons. Si le dataflow n'a pas pu consolider de données doublons, l'enregistrement serait considéré être une exception.