Mithilfe der Spaltenprofilstatistik können Sie die Vollständigkeit, Eindeutigkeit, Häufigkeit und das Muster der Datenwerte analysieren und überprüfen. Dadurch können Sie potenziell fehlerhafte Datenwerte identifizieren, die zu schlechten Analyseergebnissen führen könnten. Falls Sie Fehler bei den Werten feststellen, können Sie sie weiter untersuchen, um die Werte zu verbessern und eine bessere Vergleichsregel zu erstellen.
Der Bereich Profilstatistik ermöglicht Ihnen Folgendes:
- Wählen Sie einen Spaltennamen aus der Dropdown-Liste Spalte aus, um die Statistiken einer bestimmten Spalte anzuzeigen.Anmerkung: Die Statistiken basieren darauf, wann das Profil zuletzt ausgeführt wurde. Dabei kann es sich um Tage, Monate oder Jahre handeln. Wenn Sie die aktuellen Statistiken benötigen und davon auszugehen ist, dass sich die Daten der Quelle gegenüber der vorherigen Ausführung geändert haben könnten, müssen Sie das Profil erneut ausführen. Klicken Sie dazu auf die Schaltfläche Profil ausführen.
- Klicken Sie neben Profilstatistiken auf Weitere Details, um die detaillierten Profilstatistiken der Spalten anzuzeigen. Wenn Sie auf Weitere Details klicken, werden Sie zur Seite Ergebnisse der Datenprofilerstellung mit den entsprechenden Spaltendetails geleitet. Weitere Informationen finden Sie unter Anzeigen von Ergebnissen der Datenprofilerstellung.Anmerkung: Die Profilstatistik ist nur verfügbar, wenn Sie das Profil für die ausgewählte Spalte ausgeführt haben. Falls für Ihre ausgewählte Spalte noch nie ein Profil erstellt wurde, müssen Sie das Profil mindestens einmal für die Spalte ausführen, um die Profilstatistik verfügbar zu machen. Klicken Sie zum Ausführen eines Profils auf die Schaltfläche Profil ausführen. Sie werden zur Seite Profil hinzufügen geleitet. Weitere Einzelheiten zum Erstellen und Ausführen eines Profils finden Sie unter Erstellen eines Profils.
Im Bereich Profilstatistik werden die folgenden umfassenden Profilstatistiken einer Spalte angezeigt:
- Vollständigkeit (%): Zeigt die Vollständigkeit der Datensätze in der Spalte an. Der Prozentsatz der in der Spalte erkannten vollständigen, NULL- und leeren Zeichenfolge wird in der Legende angezeigt.
- Eindeutigkeit: Zeigt die Eindeutigkeit der in der Spalte enthaltenen Daten an, indem der Prozentsatz dieser Statistiken in der Legende angezeigt wird:
- Eindeutig: Datensätze ohne Duplikate in der Datenquelle.
- Nicht eindeutig: Datensätze mit Dubletten in der Datenquelle.
- Verschieden: Eine Liste aller Datensätze in Ihrer Datenquelle, unabhängig davon, ob es sich um eindeutige oder nicht eindeutige Datensätze handelt.
- Häufigkeit: Zeigt die Häufigkeit der in der Spalte enthaltenen Daten an.Anmerkung: Diese wird nur angezeigt, wenn der Spaltendatentyp eine Zeichenfolge ist.
- Muster: Zeigt das Muster der in der Spalte enthaltenen Daten an.Anmerkung: Diese wird nur angezeigt, wenn der Spaltendatentyp eine Zeichenfolge ist.