Field Parser - spectrum_platform - 23 - 23.1

Spectrum Enterprise Data Integration-Handbuch

Product type
Software
Portfolio
Integrate
Product family
Spectrum
Product
Spectrum > Data Integration
Version
23.1
Language
Deutsch
Product name
Spectrum Data Integration
Title
Spectrum Enterprise Data Integration-Handbuch
First publish date
2005
Last updated
2023-10-25
Published on
2023-10-25T06:22:15.743462

Der Field Parser-Schritt extrahiert Felder aus XML-Daten und Daten mit Begrenzungszeichen in der angegebenen Eingabespalte. Führen Sie folgende Schritte aus, um Field Parser-Optionen zu konfigurieren.

  1. Wählen Sie aus dem Feld Quelle die Spalte aus, in der sich die zu parsenden XML-Daten oder Daten mit Begrenzungszeichen befinden.
    Anmerkung: Das Listenfeld zeigt alle Zeichenfolgeneingabespalten.
  2. Wählen Sie je nach Typ der zu parsenden Daten XML-Format oder mit Begrenzungszeichen aus, und wählen Sie die unten beschriebenen Optionen aus.

Field Parser-Optionen für XML-Daten

Name der Option Beschreibung
Servername Gibt an, ob sich die zum Ableiten des Schemas ausgewählte Datei auf dem Computer mit dem Spectrum Enterprise Designer oder auf dem Server befindet. Wenn Sie eine Datei auf dem lokalen Computer auswählen, lautet der Servername „Arbeitsplatz“. Wenn Sie eine Datei auf dem Server auswählen, lautet der Servername Spectrum Technology Platform.
Schemadatei

Gibt den Pfad zu einer XSD-Schemadatei an. Klicken Sie auf die Ellipsenschaltfläche (...), um zum Speicherort der Datei zu gelangen. Die Schemadatei sich kann auf dem Server oder Ihrem lokalen System befinden.

Wahlweise können Sie auch eine XML-Datei statt einer XSD-Datei angeben. Wenn Sie eine XML-Datei angeben, wird das Schema auf Basis der Struktur der XML-Datei abgeleitet. Die Verwendung einer XML-Datei statt einer XSD-Datei hat die folgenden Einschränkungen:

  • Die XML-Datei darf nicht größer als 1 MB sein. Wenn die XML-Datei größer als 1 MB ist, versuchen Sie, einige der Daten zu entfernen und trotzdem die Struktur der XML beizubehalten.
  • Die Datendatei wird nicht anhand des abgeleiteten Schemas überprüft.
Anmerkung: Falls der Spectrum Technology Platform-Server unter Linux ausgeführt wird, sollten Sie berücksichtigen, dass bei Dateinamen und Pfaden auf diesen Plattformen die Groß-/Kleinschreibung beachtet wird.
Ausgabefelder

Dieser Abschnitt zeigt Details des ausgewählten Schemas. Er beinhaltet das Stammelement, gefolgt von den untergeordneten Elementen mit ihren Attributen.

Standardmäßig bleiben alle Knoten des Schemas ausgewählt. Sie können jedoch die Kästchen der Knoten deaktivieren, die nicht an den nächsten Schritt übergeben werden sollen.
  • Knoten suchen: Geben Sie den Namen des Knotens ein, zu dem Sie im Schemabaum navigieren möchten. Der eingegebene Knoten wird im Vorschaubereich unter dem Feld markiert.
  • XPath: Klicken Sie auf eine beliebige Stelle in diesem Feld, um den XML-Pfad (XPath) der Elemente und Attribute des markierten Knotens im Schemabaum anzuzeigen. Klicken Sie auf den Abwärtspfeil am rechten Ende des Feldes, um alle von Ihnen angezeigten vorherigen XPaths zu sehen.
    Anmerkung: XPath ist eine Sprache, um Informationen in einem XML-Dokument zu finden. Weitere Informationen hierzu finden Sie unter https://www.w3schools.com/xml/xml_xpath.asp

Field Parser-Optionen für Daten mit Begrenzungszeichen

Name der Option Beschreibung
Feldtrennzeichen Wählen Sie in der Dropdown-Liste das Feldtrennzeichen aus, das in der zu parsenden Spalte mit Begrenzungszeichen verwendet wird.

Wenn in der Spalte mit Begrenzungszeichen ein anderes Zeichen als Feldtrennzeichen verwendet wird, klicken Sie auf die Ellipsenschaltfläche, um ein anderes Zeichen als Feldtrennzeichen auszuwählen.

Textbegrenzungszeichen

Wählen Sie in der Dropdown-Liste das Textbegrenzungszeichen aus, das in der zu parsenden Spalte mit Begrenzungszeichen verwendet wird.

Anmerkung: Textbegrenzungszeichen sind Zeichen, die in Daten mit Begrenzungszeichen Textwerte umschließen.

Wenn in der Spalte mit Begrenzungszeichen ein anderes Textbegrenzungszeichen verwendet wird, klicken Sie auf die Ellipsenschaltfläche, um ein anderes Zeichen als Textbegrenzungszeichen auszuwählen.

Ausgabetyp

Legen Sie fest, ob die geparste Ausgabe in Form einer Liste (hierarchische Anzeige der Werte) oder als Felder erfolgen soll.

Anmerkung: Bei einer Liste als Ausgabetyp können Sie nur ein Ausgabefeld hinzufügen, während Sie bei der Option Felder mehrere Felder hinzufügen können, in denen die Werte während des Parsens aufgeteilt werden.
Ausgabefelder

In diesem Abschnitt können Sie die verschiedenen Felder, in denen die Details der Daten mit Begrenzungszeichen aufgeteilt werden sollen, hinzufügen/ändern. Sie können außerdem beliebige der hinzugefügten Ausgabefelder löschen.

Um ein neues Feld für die Anzeige der geparsten Ausgabe hinzuzufügen, klicken Sie auf die Schaltfläche Hinzufügen und führen Sie folgende Schritte im angezeigten Dialogfeld Feldeinstellung aus:
  1. Geben Sie den Namen des Feldes ein.
  2. Wählen Sie aus der Dropdown-Liste Typ den Datentyp für die Felder aus, die hinzugefügt werden. Je nach ausgewähltem Typ können mehrere Felder definiert werden. Bei Datum können Sie das Format beispielsweise als M/d/yy, MMM d.yyyy oder MMMM d.yyyy definieren. Details zu Datentypen und zum Definieren ihrer Details finden Sie unter Definieren von Feldern in einer Datei mit Begrenzungszeichen.
    Anmerkung: Wenn Sie als Datentyp Zeichenfolge auswählen, werden alle Typen von Daten mit Begrenzungszeichen geparst. Sie können jedoch je nach Daten, die Sie in dem Feld parsen möchten, auch den spezifischen Typ verwenden.
  3. Geben Sie in das Feld Position die Position des Datentyps (in der Eingabedatei) an, der in diesem Feld geparst werden soll. Beispiel: Wenn Sie im folgenden Dateiausschnitt die Datum/Uhrzeit-Werte in dem hinzuzufügenden Feld parsen möchten, geben Sie für Position den Wert 3 ein.
    true;"02/02/2022";"10/2/92 5:05 AM";598985994665542.25634;1; "Arjun";74785.155;5:05PM,1,Deepak,65152 false;"15/03/1923";"3/23/90 11:55 AM";3425699466554.2563;2; "sharma";5.1;5:45AM,2,Arjun,365273          
  4. Klicken Sie auf Feld hinzufügen und auf Schließen.
Das hinzugefügte Feld und seine Details werden im Kästchen angezeigt.
Anmerkung: Wenn Sie überzählige Leerzeichen am Anfang und Ende der Wertezeichenfolge eines Feldes entfernen möchten, aktivieren Sie das Kästchen Kürzen.

Ändern: Klicken Sie auf diese Schaltfläche, um Details eines beliebigen hinzugefügten Ausgabefelds zu ändern.

Entfernen: Klicken Sie auf diese Schaltfläche, um ein beliebiges der hinzugefügten Ausgabefelder zu entfernen.

Laufzeit: Verwenden Sie diese Schaltfläche, um mehrere Laufzeitinstanzen des Parsers anzugeben. Dies führt zu einer signifikanten Leistungsverbesserung.

OK: Klicken Sie auf diese Schaltfläche, um alle in diesem Schritt eingegebenen Details zu speichern.

Abbrechen: Klicken Sie auf diese Schaltfläche, um alle vorgenommenen Aktualisierungen abzubrechen.

Hilfe: Klicken Sie auf diese Schaltfläche, um die Hilfedatei für diesen Schritt aufzurufen.