- Vollständigkeit: Der Prozentsatz der vollständigen und unvollständigen Zeilen, die in Ihren Profildaten erkannt wurden.Anmerkung: Klicken Sie auf den Hyperlink Unvollständige Zeilen und Vollständige Zeilen, um die Datensätze in beiden Kategorien anzuzeigen.
- Relationsübersicht: Zeigt diese Details für jede Spalte in der Relation an.
- Spaltenname: Die Namen aller Spalten in der Relation
- Datentyp: Der Datentyp in der Spalte
- Vollständigkeit (%): Die Vollständigkeit der Datensätze in der Spalte
- Eindeutigkeit: Die Eindeutigkeit der in der Spalte enthaltenen Daten
- Erkannter Typ: Zeigt Semantiktypen wie E-Mail, Telefon, Ort, Vorname und Nachname an, die in der Zeichenfolge in dieser Spalte ermittelt wurden.
- Weitere Statistiken: Zeigt verschiedene andere Statistiken wie Min. Länge, Max. Länge und Textmuster an.
- Häufigkeit NULL-Anzahl: Zeigt die Anzahl der Nullwerte in jeder Relationszeile an.
Anzeigen von Ausreißern
Sie können eine Zusammenfassung der gefundenen Ausreißer für jede Spalte in Ihrer Relation anzeigen, indem Sie auf die Registerkarte Ausreißeranalyse klicken. Auf dieser Registerkarte werden Vorkommnisse nach Kategorie von Mustern, Werten, Längen oder Häufigkeiten für eine Spalte angezeigt, die nicht in den Bereich anderer Beobachtungen fallen.
Beispiel: Die zulässige Länge von Ländernamen beträgt bis zu 14 Zeichen. Zeichenfolgen mit 15 Zeichen werden in Ihren Daten erkannt. Diese Zeichenfolgen wird unter Längenausreißer kategorisiert. Die unterstützten Kategorien sind Längenausreißer, Häufigkeitsausreißer, Musterausreißer, Numerische Ausreißer, Semantikausreißer und Datentypausreißer.
Anzeigen von falsch formatierten Datensätzen
- Zeilen mit einer geringeren Anzahl von Feldern als die Anzahl der definierten Spalten
- Zeilen mit einer größeren Anzahl von Feldern als die Anzahl der definierten Spalten
Sie können auch eine Vorschau der falsch formatierten Datensätze anzeigen, indem Sie auf die Kategorie klicken. In der Vorschau werden die Datensatznummer, der Datensatz und der Grund für die Kategorisierung eines Datensatzes als falsch formatiert angezeigt.
Anzeigen von Datensatzdubletten
Sie können eine Übersicht der in Ihrer Relation erkannten Datensatzdubletten anzeigen, indem Sie auf die Registerkarte Analyse der Datensatzdubletten klicken.