Auswählen von Spalten - discovery - 23 - 23.1

Spectrum Discovery-Handbuch

Product type
Software
Portfolio
Verify
Product family
Spectrum
Product
Spectrum > Discovery
Version
23.1
Language
Deutsch
Product name
Spectrum Discovery
Title
Spectrum Discovery-Handbuch
First publish date
2007
Last updated
2023-10-25
Published on
2023-10-25T06:23:10.810287
In diesem Abschnitt werden die Spalten Ihrer Beispieldaten in einem Tabellenformat angezeigt. Sie müssen die Spalten auswählen, für die Sie einen Vergleich durchführen möchten.

In diesem Verfahren wird beschrieben, wie Sie Spalten zum Erstellen von Gruppen und zum Generieren von Vergleichskriterien auswählen:

  1. Klicken Sie auf die Schaltfläche Semantiktyp ermitteln. Die ermittelten Semantiktypen in den ausgewählten Datensätzen werden in der Spalte Semantiktyp angezeigt. Standardmäßig wird KEINE angezeigt.
    Wenn der gewünschte Semantiktyp nicht angezeigt wird, können Sie ihn aus dem Dropdown-Menü auswählen, nachdem Sie das entsprechende Kontrollkästchen dieser Spalte aktiviert haben.
    Anmerkung: Dieser Schritt wird empfohlen, um bessere Vergleichskriterien zu erstellen. Auf der Grundlage eines ausgewählten Semantiktyps werden relevante Algorithmen zum Erzeugen von Vergleichskriterien verwendet. Zum Beispiel werden phonetische Algorithmen für den Semantiktyp Name und nicht für die Telefonnummer und die Postleitzahl verwendet.
  2. Schieben Sie Intelligente Probenahme auf Ein, um alle Datensätze für die Probenahme zu berücksichtigen. Bei Aus werden die ersten 20.000 Datensätze für die Probenahme verwendet.
  3. Aktivieren Sie das Kontrollkästchen Spaltenname für die Spalten, die zum Generieren von Vergleichskriterien ausgewählt werden sollen.
  4. Geben Sie über die Spalte Umgang mit Nullwerten an, wie die Nullwerte in den jeweiligen Spalten behandelt werden sollen. Die Optionen sind:
    • Null als Übereinstimmung: Hiermit werden die freien Felder gleichwertig mit dem entsprechenden Feld eines Datensatzpaares behandelt.
    • Null als Nichtübereinstimmung: Hiermit werden die freien Felder nicht gleichwertig mit dem entsprechenden Feld eines Datensatzpaares behandelt.
      Anmerkung: Dies ist der Standardwert.

      Die hier getroffene Auswahl wird im Enterprise Designer unter der Option Fehlende Daten der Vergleichsregel angezeigt. Wenn Sie Null als Übereinstimmung auswählen, wird Als 100 zählen vorausgewählt. Wenn Sie Null als Nichtübereinstimmung auswählen, wird Als 0 zählen vorausgewählt.

    Anmerkung: Diese Option wird global auf ein Feld angewendet und bleibt für verschiedene Bedingungen eines Feldes einheitlich.
  5. Ordnen Sie Ihre Spalten in der Reihenfolge, in der Proben entnommen werden sollen. Um eine Rangfolge zu erstellen, müssen Sie Ihren Cursor ganz links in der Spalte platzieren und ihn nach oben oder unten bewegen, wenn der Cursor als Hand angezeigt wird.
  6. Klicken Sie auf das Symbol , um Ihre Änderungen zu speichern und zum nächsten Schritt zu gelangen.
  7. Klicken Sie auf das Symbol , um die aktuelle Aufgabe abzubrechen.
Basierend auf den ausgewählten Spalten und nicht überwachten Algorithmen für maschinelles Lernen werden automatisch Gruppen von Datensätzen generiert und diese auf der nächsten Seite zum Tagging angezeigt.