Wenn Sie ein Administrator sind, können Sie Semantiktypen erstellen.
- Klicken Sie in der Navigationsleiste auf Semantiktypen.
- Stellen Sie sicher, dass die Registerkarte Semantiktypen ausgewählt ist.
- Klicken Sie oben rechts im Raster auf die Schaltfläche Neuen Semantiktyp erstellen.
- Füllen Sie im Dialogfeld Semantiktypen erstellen die erforderlichen Felder aus. Weitere Informationen über die Felder im Dialogfeld Semantiktypen erstellen finden Sie unten.
- Klicken Sie nach Abschluss des Vorgangs auf Erstellen oder auf Erstellen oder weiteren hinzufügen.
- Gültigkeitsdatum - Der Standardwert ist das aktuelle Datum. Es wird jedoch nicht auf der Data360 Govern-Benutzeroberfläche angezeigt.
- Semantikquelle - Der Standardwert ist Benutzerdefiniert.
- Erstellungsdatum
- Änderungsdatum
- Letzte Änderung von
- Erstellt von
- UID
Erstellen von Semantiktypen-Felder
- Name - Geben Sie einen deskriptiven und eindeutigen Namen für den Semantiktyp ein.
- Abfragekriterium - Der eigentliche Semantiktyp. Beispiel: XYZ_ABC.123. Beispiele für integrierte Semantiktypen und ihre Abfragekriterien finden Sie unter Semantiktypen. Dies ist ein Pflicht-Textfeld und sollte für die Umgebung eindeutig sein. Anmerkung: Das Abfragekriterium kann nach seiner Erstellung nicht mehr bearbeitet werden.
-
Schwellenwert - Geben Sie einen Wert zwischen 0 und 100 ein. Definiert den Prozentsatz gültiger Werte, der innerhalb des Beispieldatensatzes erzielt werden muss, damit er als dieser Semantiktyp klassifiziert wird.
-
Priorität - Geben Sie eine Zahl ein, um die Reihenfolge zu bestimmen, in der der Semantiktyp für einen Datensatz verwendet werden soll. Je höher die Priorität, desto früher wird er angewendet.
-
Status - Wählen Sie aus: Entwurf, Wird geprüft, Zertifiziert. Bei Verwendung mit Konnektoren wird ein benutzerdefinierter Semantiktyp zur Verarbeitung an Data360 Analyze gesendet. Er kann jedoch nur verwendet werden, wenn er den Status Zertifiziert hat. Weitere Informationen zur Verarbeitung von Semantiktypdaten finden Sie im Hilfethema Daten-Profiler in der Data360 Analyze-Hilfe.
- Übereinstimmungstyp - Wählen Sie aus:
- Liste mit Werten - Klassifiziert Daten basierend auf einer Liste von Zeichenfolgen, die in den zugrunde liegenden Daten vorhanden sind. Sie können auch Wörter angeben, nach denen in der Spaltenüberschrift gesucht werden kann.
- Muster in Daten - Klassifiziert Daten basierend auf einem Muster, das in den Daten vorhanden ist. Sie können auch Wörter angeben, nach denen in der Spaltenüberschrift gesucht werden kann.
- Zahlen - Klassifiziert ein Zahlenfeld basierend auf einem Kopfzeilennamen, minimalen oder maximalen Werten in den Daten oder einer bestimmten Anzahl von Ziffern oder Dezimalstellen. Sie sollten Wörter angeben, nach denen in der Spaltenüberschrift gesucht werden kann.
- Erweitert (JSON) - Ermöglicht es Ihnen, einen benutzerdefinierten JSON-Ausdruck einzugeben, um zusätzliche Eigenschaften für den Semantiktyp zu bestimmen. Wir empfehlen, dass dieser Übereinstimmungstyp nur von einer Person konfiguriert wird, die Erfahrung in der Erstellung der JSON-Syntax hat.
Je nach ausgewähltem Übereinstimmungstyp werden zusätzliche Felder angezeigt:
- JSON - Geben Sie einen JSON-Ausdruck ein, um zusätzliche Eigenschaften für den Semantiktyp zu bestimmen, die nicht an anderer Stelle in diesem Dialogfeld definiert sind.
- Regulärer Ausdruck - Geben Sie das Muster der Daten für diesen Semantiktyp als regulären Ausdruck ein.
- Test-Zeichenfolge für einen regulären Ausdruck - Geben Sie optional Text ein und klicken Sie auf Validieren, um eine Zeichenfolge anhand des im Feld Regulärer Ausdruck eingegebenen Musters zu testen.
- Gültige Werte - Geben Sie die entsprechenden alphanumerischen Werte ein. Es erfolgt keine automatische Vervollständigung und es wird eine Überprüfung auf Dubletten ohne Berücksichtigung der Groß-/Kleinschreibung durchgeführt. Es ist mindestens ein Wert erforderlich. Die maximale Anzahl der Werte beträgt 500.
- Ungültige Werte - Geben Sie die entsprechenden alphanumerischen Werte ein. Es erfolgt keine automatische Vervollständigung und es wird eine Überprüfung auf Dubletten ohne Berücksichtigung der Groß-/Kleinschreibung durchgeführt. Dieses Feld ist optional. Die maximale Anzahl der Werte beträgt 500.
- Minimale Anzahl an Beispielen - Wählen Sie die entsprechende positive Ganzzahl aus oder geben Sie sie ein. Damit dieser Semantiktyp verwendet werden kann, muss der Datensatz mindestens die angegebene Anzahl von Einträgen enthalten.
- Minimum Maximum vorhanden - Wählen Sie true oder false, um festzulegen, ob sowohl der Minimal- als auch der Maximalwert im Datensatz vorhanden sein muss, damit der Semantiktyp erkannt wird.
- Minimum - Geben Sie eine positive Dezimalzahl ein, die den niedrigsten gültigen Wert für diesen Semantiktyp darstellt. Dies ist ein Pflichtfeld, wenn Minimum-Maximum vorhanden auf „true“ festgelegt ist.
- Maximum - Geben Sie eine positive Dezimalzahl ein, die den höchsten gültigen Wert für diesen Semantiktyp darstellt. Dies ist ein Pflichtfeld, wenn Minimum-Maximum vorhanden auf „true“ festgelegt ist.
- Gültige Gebietsschemata - Wählen Sie die entsprechenden Gebietsschemata aus der Liste aus. Dieser Semantiktyp wird verwendet, um Assets zu klassifizieren, wenn Sprache und Region einem der angegebenen Gebietsschemata entsprechen.
- Regulärer Ausdruck (Kopfzeile) - Wählen Sie einen Ausdruck aus der Dropdown-Liste aus, und ändern Sie ihn dann bei Bedarf, oder geben Sie die entsprechende Zeichenfolge als regulären Ausdruck ein.
- Test-Zeichenfolge für einen regulären Ausdruck - Geben Sie den Text ein und klicken Sie auf Validieren, um eine Zeichenfolge anhand des im Feld Regulärer Ausdruck eingegebenen Musters zu testen.
- Konfidenz (Kopfzeile) - Geben Sie den Konfidenz-Prozentwert ein, der erreicht werden muss, um den Regulären Ausdruck (Kopfzeile) bei der Bestimmung des Semantiktyps verwenden zu können. Dies ist ein Pflichtzahlfeld mit einem Wert zwischen 0 und 100, wenn der Header-Regulärausdruck ausgefüllt wird.