Indexoptionen für die einfache Suche – Candidate Finder-Optionen - dataflow_designer - spectrum_quality_1 - 23 - 23.1

Spectrum Data Quality-Handbuch

Product type
Software
Portfolio
Verify
Product family
Spectrum
Product
Spectrum > Qualität > Spectrum Quality
Version
23.1
Language
Deutsch
Product name
Spectrum Data Quality
Title
Spectrum Data Quality-Handbuch
First publish date
2007
Last updated
2023-10-25
Published on
2023-10-25T06:24:19.942092

Finder-Typ

Wählen Sie den Suchindex aus.

Name

Wählen Sie den entsprechenden Index aus, der mithilfe des Schrittes Write to Search Index im Rahmen der bereitgestellten „Advanced Matching“-Schritte im Enterprise Designer erstellt wurde.

Startdatensatz

Geben Sie die Datensatznummer ein, bei der die Suchergebnisse beginnen sollen. Der Standardwert ist 1.

Maximale Ergebnisanzahl

Geben Sie die maximale Anzahl an Ergebnissen ein, die vom Suchindex zurückgegeben werden sollen. Der Standardwert ist 10.
Anmerkung: Wenn „Maximale Anzahl Ergebnisse“ beliebig groß ist, verarbeiten Sie sie in Batches mithilfe des Feldes Batch-Größe abrufen.

Batch-Größe abrufen

Wenn Maximale Anzahl Ergebnisse beliebig groß ist, geben Sie die Größe der Batches ein, in denen die Ergebnisse verarbeitet werden sollen. Dies optimiert die Verarbeitung einer großen Anzahl von Datensätzen. Der Standardwert ist 10000.

Der empfohlene Wert für eineBatch-Größe ist ein Wert kleiner als der Wert Maximale Anzahl Ergebnisse, und wenn der Wertder Batch-Größe größer als der Wert von Maximale Anzahl Ergebnisse ist, werden die Datensätze in einem einzigen Batch verarbeitet.

Anmerkung: Dieses Feld gilt nur für die vom Cluster unterstützte Suchmaschine und nicht für die Legacy-Suchmaschine.

Anzahl der Übereinstimmungen zurückgeben

Gibt die Summe der ermittelten Übereinstimmungen zurück. Wenn Sie beispielsweise den Standardwert von 10 für das obige Feld „Maximale Anzahl Ergebnisse“ verwenden, werden nur 10 Ergebnisse zurückgegeben. Wenn Sie dieses Kästchen allerdings aktivieren, wird im Ausgabefeld „Gesamtanzahl Übereinstimmungen“ angezeigt, wie viele Übereinstimmungen während der Verarbeitung ermittelt wurden.

Indexsuchtyp

Bestimmt den Typ der Indexsuche, die Sie durchführen möchten. Wählen Sie Einfache Suche aus.

Indexfelder

Wählen Sie die Indexfelder aus, die Sie für den Vergleich in der einfachen Suche verwenden möchten.

Eingabefeld

Wählen Sie das Eingabefeld aus, das Sie für den Vergleich in der einfachen Suche verwenden möchten.

Eingabeanalysator

Geben Sie an, welcher Analysator zum Tokenisieren der Eingabezeichenfolge verwendet werden soll. Eine von diesen:

  • Standard: Bietet einen grammatikbasierten Token-Ersteller, der ein Superset der Analysatoren „Leerzeichen“ und „Stoppwort“ enthält. Erkennt die englische Interpunktion zum Aufschlüsseln von Wörtern, kennt die zu ignorierenden Wörter (über den Stoppwort-Analysator) und führt Suchen durch, welche die Groß-/Kleinschreibung nicht beachten, indem er Vergleiche in Kleinschreibung durchführt. Die Zeichenfolge „Precisely Software“ würde beispielsweise als zwei Token zurückgegeben werden: „Precisely“ und „Software“.
  • Leerzeichen: Trennt Token mit einem Leerzeichen. Eine Art Untergruppe des standardmäßigen Analysators, da Wortumbrüche in englischen Texten basierend auf Leerzeichen und Zeilenumbrüchen erkannt werden.
  • StopWord: Entfernt Wörter wie „der/die/das“, „und“ und „ein/e/er/es“, um die Indexgröße zu reduzieren und die Leistung zu verbessern.
  • Schlüsselwort: Entfernt ein Token aus einem Datenstream. Die Zeichenfolge „Precisely Software“ würde beispielsweise als ein einzelner Token zurückgegeben werden: Precisely Software.
  • Russisch: Unterstützt Indizes und Type-Ahead-Dienste in russischer Sprache. Unterstützt ebenfalls viele Stoppwörter und entfernt Wörter wie „und“, „ich“ und „du“, um die Indexgröße zu reduzieren und die Leistung zu verbessern.
  • Deutsch: Unterstützt Indizes und Type-Ahead-Dienste in deutscher Sprache. Unterstützt ebenfalls viele Stoppwörter und entfernt Wörter wie „der/die/das“, „und“ und „ein/e/er/es“, um die Indexgröße zu reduzieren und die Leistung zu verbessern.
  • Dänisch: Unterstützt Indizes und Type-Ahead-Dienste in dänischer Sprache. Unterstützt ebenfalls viele Stoppwörter und entfernt Wörter wie „um“, „und“ und „ein/e/er/es“, um die Indexgröße zu reduzieren und die Leistung zu verbessern.
  • Niederländisch: Unterstützt Indizes und Type-Ahead-Dienste in niederländischer Sprache. Unterstützt ebenfalls viele Stoppwörter und entfernt Wörter wie „der/die/das“, „und“ und „ein/e/er/es“, um die Indexgröße zu reduzieren und die Leistung zu verbessern.
  • Finnisch: Unterstützt Indizes und Type-Ahead-Dienste in finnischer Sprache. Unterstützt ebenfalls viele Stoppwörter und entfernt Wörter wie „ist“, „und“ und „von“, um die Indexgröße zu reduzieren und die Leistung zu verbessern.
  • Französisch: Unterstützt Indizes und Type-Ahead-Dienste in französischer Sprache. Unterstützt ebenfalls viele Stoppwörter und entfernt Wörter wie „der/die/das“, „und“ und „ein/e/er/es“, um die Indexgröße zu reduzieren und die Leistung zu verbessern.
  • Ungarisch: Unterstützt Indizes und Type-Ahead-Dienste in ungarischer Sprache. Unterstützt ebenfalls viele Stoppwörter und entfernt Wörter wie „der/die/das“, „und“ und „ein/e/er/es“, um die Indexgröße zu reduzieren und die Leistung zu verbessern.
  • Italienisch: Unterstützt Indizes und Type-Ahead-Dienste in italienischer Sprache. Unterstützt ebenfalls viele Stoppwörter und entfernt Wörter wie „der/die/das“, „und“ und „ein/e/er/es“, um die Indexgröße zu reduzieren und die Leistung zu verbessern.
  • Norwegisch: Unterstützt Indizes und Type-Ahead-Dienste in norwegischer Sprache. Unterstützt ebenfalls viele Stoppwörter und entfernt Wörter wie „der/die/das“, „und“ und „ein/e/er/es“, um die Indexgröße zu reduzieren und die Leistung zu verbessern.
  • Portugiesisch: Unterstützt Indizes und Type-Ahead-Dienste in portugiesischer Sprache. Unterstützt ebenfalls viele Stoppwörter und entfernt Wörter wie „der/die/das“, „und“ und „ein/e/er/es“, um die Indexgröße zu reduzieren und die Leistung zu verbessern.
  • Spanisch: Unterstützt Indizes und Type-Ahead-Dienste in spanischer Sprache. Unterstützt ebenfalls viele Stoppwörter und entfernt Wörter wie „der/die/das“, „und“ und „ein/e/er/es“, um die Indexgröße zu reduzieren und die Leistung zu verbessern.
  • Schwedisch: Unterstützt Indizes und Type-Ahead-Dienste in schwedischer Sprache. Unterstützt ebenfalls viele Stoppwörter und entfernt Wörter wie „der/die/das“, „und“ und „ein/e/er/es“, um die Indexgröße zu reduzieren und die Leistung zu verbessern.
  • Hindi: Unterstützt Indizes und Type-Ahead-Dienste in Hindi. Unterstützt ebenfalls viele Stoppwörter und entfernt Wörter wie „von“, „und“ und „ein/e/er/es“, um die Indexgröße zu reduzieren und die Leistung zu verbessern.

Registerkarte „Ausgabefelder“

Aktivieren Sie das Kästchen Einschließen, um auszuwählen, welche gespeicherten Felder in der Ausgabe enthalten sein sollen.
Anmerkung: Wenn das Eingabefeld aus einem früheren Schritt im Datenfluss stammt und denselben Namen wie der gespeicherte Feldname aus dem Suchindex aufweist, überschreiben die Werte aus dem Eingabefeld die Werte im Ausgabefeld.