Definieren einer kulturspezifischen Parsing-Grammatik - spectrum_quality_1 - 23 - 23.1

Spectrum Data Quality-Handbuch

Product type
Software
Portfolio
Verify
Product family
Spectrum
Product
Spectrum > Qualität > Spectrum Quality
Version
23.1
Language
Deutsch
Product name
Spectrum Data Quality
Title
Spectrum Data Quality-Handbuch
First publish date
2007
Last updated
2023-10-25
Published on
2023-10-25T06:24:19.942092

Mit einer kulturspezifischen Parsing-Grammatik können Sie verschiedene Parsing-Regeln für verschiedene Sprachen und Kulturen angeben. Dies ermöglicht es Ihnen, in einem einzelnen „Open Parser“-Schritt Daten aus verschiedenen Ländern zu parsen, z. B. Telefonnummern aus den Vereinigten Staaten und Telefonnummern aus Großbritannien. Die einzelnen Eingabedatensätze werden standardmäßig mit der Parsing-Grammatik der jeweiligen Kultur geparst, und zwar in der Reihenfolge, die im „Open Parser“-Schritt angegeben ist. Wenn Sie möchten, dass die Parsing-Grammatik einer bestimmten Kultur für diesen Datensatz verwendet wird, können Sie auch das Feld „CultureCode“ hinzufügen. Weitere Informationen finden Sie unter Zuweisen einer Parsing-Kultur zu einem Datensatz.

Anmerkung: Wenn Sie eine domänenunabhängige Parsing-Grammatik erstellen möchten, siehe Definieren von domänenunabhängigen Parsing-Grammatiken in Datenflüssen.
  1. Öffnen Sie im Enterprise Designer die Menüoptionen Tools > Open Parser Domain Editor.
  2. Klicken Sie auf die Registerkarte Domänen.
  3. Klicken Sie auf Hinzufügen.
  4. Geben Sie im Feld Name einen Domänennamen ein.
  5. Geben Sie im Feld Beschreibung eine Beschreibung des Domänennamens ein.
  6. Klicken Sie auf OK, wenn Sie eine neue, leere Domäne erstellen möchten. Gehen Sie wie folgt vor, wenn Sie eine neue Domäne basierend auf einer anderen Domäne erstellen möchten:
    1. Wählen Sie Andere Domäne als Vorlage verwenden aus, wenn Sie eine neue Domäne basierend auf einer anderen Domäne erstellen möchten.
    2. Wählen Sie eine Domäne aus der Liste aus. Wenn Sie im nächsten Schritt auf OK klicken, wird die neue Domäne erstellt. Die neue Domäne enthält die gesamte kulturspezifische Parsing-Grammatik, die in der von Ihnen ausgewählten Domänenvorlage definiert wurde.
    3. Klicken Sie auf OK.
  7. Definieren Sie die Parsing-Grammatik für die globale Kultur. Die globale Kultur ist die Standardkultur und wird zum Parsen von Datensätzen verwendet, die eine Kultur aufweisen, für die keine kulturspezifische Parsing-Grammatik definiert worden ist.
    1. Wählen Sie auf der Registerkarte Grammatiken die neue von Ihnen erstellte Domäne aus.
    2. Wenn Sie aus einer Vorlage eine Domäne erstellt haben, werden möglicherweise bereits Kulturen aufgeführt.
      • Wenn Kulturen aufgeführt werden, wählen Sie Globale Kultur aus und klicken Sie anschließend auf Bearbeiten.
      • Wenn keine Kulturen aufgeführt werden, klicken Sie auf Hinzufügen, wählen Sie Globale Kultur aus und klicken Sie anschließend auf OK.
    3. Tragen Sie auf der Registerkarte Grammatik die Parsing-Grammatik für die globale Kultur ein. Sie können die Registerkarten Befehle, Grammatikregeln und RegEx-Tags verwenden, um vordefinierte Parsing-Grammatikelemente einzufügen. Um ein vordefiniertes Element einzugeben, platzieren Sie den Cursor an der Stelle, an der Sie das Element einfügen möchten, und doppelklicken Sie anschließend auf das Element, das hinzugefügt werden soll.

      Auf der Registerkarte Befehle werden Parsing-Befehle angezeigt. Für Informationen zu den verfügbaren Befehlen siehe Grammatiken.

      Auf der Registerkarte Grammatikregeln werden die von Ihnen im Dialogfeld „Kultureigenschaften“ erstellten Grammatikregeln angezeigt. Für weitere Informationen zum Erstellen von Grammatikregeln siehe Definieren der Grammatikregeln einer Kultur.

      Auf der Registerkarte RegEx-Tags werden die von Ihnen im Dialogfeld „Kultureigenschaften“ erstellten RegEx-Tags angezeigt. Für weitere Informationen zum Erstellen von RegEx-Tags siehe Definieren von RegEx-Tags für eine Kultur.

    4. Klicken Sie auf Überprüfen, um die von Ihnen erstellte Syntax zu überprüfen. Das Feature zur Überprüfung der Parsing-Grammatik zeigt alle Fehler in Ihrer Syntax an und umfasst die aufgetretenen Fehler, die Zeile und die Spalte, in denen die Fehler aufgetreten sind, und den Befehl, die Grammatikregel oder den RegEx-Tag, wo die Fehler aufgetreten sind.
    5. Klicken Sie auf die Registerkarte Vorschau, um die Ergebnisse Ihrer Grammatik mit Beispieldaten zu testen. Geben Sie unter Eingabedaten die Beispieldaten ein, die geparst werden sollen. Geben Sie einen Datensatz pro Zeile ein. Klicken Sie anschließend auf die Schaltfläche Vorschau. Die geparsten Ausgabefelder werden im Raster Ergebnisse angezeigt. Weitere Informationen über Ausgabefelder finden Sie unter Ausgabe. Weitere Informationen zur Ablaufverfolgung finden Sie unter Ablaufverfolgung von endgültigen Parsing-Ergebnissen. Wenn die Ergebnisse nicht Ihren Erwartungen entsprechen, klicken Sie auf die Registerkarte Grammatiken und fahren Sie so lange mit der Bearbeitung der Parsing-Grammatik und dem Testen repräsentativer Eingabedaten fort, bis die Parsing-Grammatik die erwarteten Ergebnisse erzeugt.
    6. Klicken Sie auf OK, wenn Sie mit dem Definieren der Parsing-Grammatik für die globale Kultur fertig sind.
  8. Definieren Sie für jede gewünschte Kultur eine kulturspezifische Grammatik. Um kulturspezifische Grammatiken hinzuzufügen, klicken Sie auf Hinzufügen und definieren Sie die Grammatik mit den gleichen Schritten wie für die globale Kultur. Wiederholen Sie diese Schritte nach Bedarf, um so viele Kulturen wie benötigt hinzuzufügen.
  9. Wenn Sie mit dem Hinzufügen kulturspezifischer Parsing-Grammatiken fertig sind, klicken Sie auf OK.

Die Domäne und die Kulturen, die Sie erstellt haben, können jetzt im „Open Parser“-Schritt zum Durchführen eines Parsings verwendet werden.