Write to File - data_integration_1 - 23 - 23.1

Spectrum Enterprise Data Integration-Handbuch

Product type
Software
Portfolio
Integrate
Product family
Spectrum
Product
Spectrum > Data Integration
Version
23.1
Language
Deutsch
Product name
Spectrum Data Integration
Title
Spectrum Enterprise Data Integration-Handbuch
First publish date
2005
Last updated
2023-10-25
Published on
2023-10-25T06:22:15.743462
„Write to File“ schreibt die Datenflussausgabe in ein Flatfile.
  • Informationen zum Schreiben von Datensätzen mit unterschiedlichen Formaten finden Sie unter Write to Variable Format File.
  • Informationen zum Schreiben von Datensätzen in eine XML-Datei finden Sie unter Write to XML.
Tipp: Sie können Ihre Quelle kopieren und als Datenladung in den Datenfluss einfügen, um die Datei schnell zu konfigurieren und dieselben Felder zu verwenden, die Sie in der Quelle definiert haben.
Voraussetzung: Führen Sie die folgenden Schritte aus, um eine Datei in eine der Dateisystemverbindungsarten wie FTP, Cloud, Amazon AWS S3 und HDFS zu schreiben:
  1. Erstellen Sie mithilfe der Spectrum Management Console oder Discovery eine Verbindung zu diesen Dateiservern. Weitere Details finden Sie im Abschnitt Definieren von Verbindungen.
  2. Wählen Sie den erforderlichen Dateipfad mithilfe des Feldes Dateiname auf der Registerkarte Dateieigenschaften aus (siehe unten).

Registerkarte „Dateieigenschaften“

Feldname

Beschreibung

Servername Dies gibt an, ob sich die von Ihnen als Eingabe ausgewählte Datei auf dem Computer mit dem Spectrum Enterprise Designer oder auf dem Spectrum Technology Platform-Server befindet. Wenn Sie eine Datei auf dem lokalen Computer auswählen, lautet der Servername „Arbeitsplatz“. Wenn Sie eine Datei auf dem Server auswählen, lautet der Servername Spectrum Technology Platform.

Dateiname

Gibt den Pfad zur Datei an. Klicken Sie auf die Ellipsenschaltfläche (...), um die gewünschte Datei zu suchen.

Beim Schreiben einer Datei auf einen HDFS-Dateiserver werden die folgenden Komprimierungsformate unterstützt:
  1. GZIP (.gz)
  2. BZIP2 (.bz2)
Anmerkung: Geben Sie beim Dateinamen die passende Erweiterung an, um das gewünschte Komprimierungsformat anzugeben, das beim Schreiben in die Datei verwendet werden soll.
Achtung: Falls der Spectrum Technology Platform-Server unter Linux ausgeführt wird, sollten Sie berücksichtigen, dass bei Dateinamen und Pfaden auf diesen Plattformen die Groß-/Kleinschreibung beachtet wird.
Datensatztyp Dies ist das Format der Datensätze in der Datei. Wählen Sie eine Option:
Zeilensequenziell
Dies ist eine Textdatei, in der Datensätze durch ein Zeilenendzeichen (EOL, End of Line) wie Zeilenumbruch oder Zeilenvorschub (CR oder LF, Carriage Return oder Line Feed) getrennt sind und jedes Feld über feste Startzeichen- und Endzeichenpositionen verfügt.
Feste Breite
Dies ist eine Textdatei, in der jeder Datensatz eine bestimmte Anzahl von Zeichen lang ist und jedes Feld über feste Startzeichen- und Endzeichenpositionen verfügt.
Mit Begrenzungszeichen
Dies ist eine Textdatei, in der Datensätze durch ein Zeilenendzeichen (EOL, End of Line) wie Zeilenumbruch oder Zeilenvorschub (CR oder LF, Carriage Return oder Line Feed) getrennt sind und jedes Feld durch ein angegebenes Zeichen wie beispielsweise ein Komma getrennt ist.
Zeichencodierung Dies ist die Codierung der Textdatei. Weitere Informationen finden Sie unter Zeichencodierungen.
Feldtrennzeichen Gibt das Zeichen an, das zum Trennen von Feldern in einer Datei mit Begrenzungszeichen verwendet wird. Im folgenden Beispiel wird ein Pipe-Zeichen ( | ) im Datensatz als Feldtrennzeichen verwendet:
7200 13TH ST|MIAMI|FL|33144

Die folgenden Zeichen stehen zur Definition als Feldtrennzeichen zur Verfügung:

  • Leerzeichen
  • Tabstopp
  • Komma
  • Punkt
  • Semikolon
  • Pipe

Wenn in der Datei ein anderes Zeichen als Feldtrennzeichen verwendet wird, klicken Sie auf die Ellipsenschaltfläche, um ein anderes Zeichen als Begrenzungszeichen auszuwählen.

Textbegrenzungszeichen

Dies ist das Zeichen, das in einer Datei mit Begrenzungszeichen Textwerte umschließt.

Im folgenden Beispiel werden im Datensatz doppelte Anführungszeichen (") als Textbegrenzungszeichen verwendet.

"7200 13TH ST"|"MIAMI"|"FL"|"33144"

Die folgenden Zeichen stehen zur Definition als Textbegrenzungszeichen zur Verfügung:

  • einfaches Anführungszeichen ( ' )
  • doppeltes Anführungszeichen ( " )

Wenn in der Datei ein anderes Textbegrenzungszeichen verwendet wird, klicken Sie auf die Ellipsenschaltfläche, um ein anderes Zeichen als Textbegrenzungszeichen auszuwählen.

Datensatz-Trennzeichen

Gibt das Zeichen an, das zum Trennen von Datensätzen in einer zeilensequenziellen Datei oder einer Datei mit Begrenzungszeichen verwendet wird. Dieses Feld ist nicht verfügbar, wenn Sie das Kästchen Standard-Zeilenende verwenden aktivieren.

Die verfügbaren Einstellungen für Datensatz-Trennzeichen sind:

Linux (U+000A)
Die Datensätze sind durch ein Zeilenvorschubzeichen getrennt. Dies ist bei Linux-Systemen das standardmäßige Datensatz-Trennzeichen.
Macintosh (U+000D)
Die Datensätze sind durch ein Zeilenumbruchzeichen getrennt. Dies ist bei Macintosh-Systemen das standardmäßige Datensatz-Trennzeichen.
Windows (U+000D U+000A)
Die Datensätze sind durch ein Zeilenumbruchzeichen gefolgt von einem Zeilenvorschubzeichen getrennt. Dies ist bei Windows-Systemen das standardmäßige Datensatz-Trennzeichen.

Wenn in der Datei ein anderes Datensatz-Trennzeichen verwendet wird, klicken Sie auf die Ellipsenschaltfläche, um ein anderes Zeichen als Datensatz-Trennzeichen auszuwählen.

Standard-Zeilenende verwenden

Gibt an, dass das standardmäßige Zeilenendzeichen (EOL) des Betriebssystems, auf dem der Spectrum Technology Platform-Server läuft, als Datensatz-Trennzeichen der Datei verwendet wird.

Wählen Sie diese Option nicht aus, wenn in der Datei ein Zeilenendzeichen verwendet wird, das sich vom standardmäßigen Zeilenendzeichen des Betriebssystems des Servers unterscheidet. Wenn in der Datei beispielsweise ein Windows-Zeilenendzeichen verwendet wird, der Server aber auf Linux läuft, aktivieren Sie diese Option nicht. Wählen Sie stattdessen im Feld Datensatz-Trennzeichen die Option „Windows“ aus.

Datensatzlänge

Geben Sie bei Dateien an, die Datensätze mit fester Breite enthalten, die genaue Anzahl von Zeichen jedes Datensatzes.

Geben Sie bei zeilensequenziellen Dateien die Länge des längsten Datensatzes in der Datei in Zeichen an.

Erste Zeile ist Kopfzeilen-Datensatz

Gibt an, ob der erste Datensatz in einer Datei mit Begrenzungszeichen Überschriften und keine Daten enthält.

Im folgenden Dateiausschnitt ist der erste Datensatz ein Kopfzeilen-Datensatz.

"AddressLine1"|"City"|"StateProvince"|"PostalCode" "7200 13TH ST"|"MIAMI"|"FL"|"33144" "One Global View"|"Troy"|"NY"|12180
Datensätze mit weniger Feldern als in der Definition als falsch formatiert behandeln

Datensätze in Dateien mit Begrenzungszeichen, die weniger Felder enthalten, als auf der Registerkarte Felder definiert wurden, werden als falsch formatiert behandelt.

Importieren

Dies importiert die Definition des Dateilayouts, die Codierungseinstellung und Sortieroptionen aus einer Einstellungsdatei. Die Einstellungsdatei wird beim Exportieren von Einstellungen durch einen anderen „Read from File“- oder „Write to File“-Schritt erstellt. Dieser verwendet dieselbe Eingabedatei oder eine Datei, die über dasselbe Layout wie die Datei verfügt, mit der Sie arbeiten.

Exportieren

Dies exportiert die Definition des Dateilayouts, die Codierungseinstellung und Sortieroptionen in eine Einstellungsdatei. Sie können anschließend diese Einstellungen in andere „Read from File“- oder „Write to File“-Schritte importieren, die dieselbe Eingabedatei oder eine Datei mit demselben Layout wie die Datei verwenden, mit der Sie gerade arbeiten. Sie können die Einstellungsdatei auch mit dem Job Executor verwenden, um die Dateieinstellungen zur Laufzeit anzugeben.

Informationen zur Einstellungsdatei finden Sie unter Die Dateidefinitions-Einstellungsdatei.

Registerkarte „Felder“

Die Registerkarte „Felder“ definiert die Namen, Positionen und, bei Dateien vom Typ „Feste Breite“ und „Zeilensequenziell“, die Länge der Felder in der Datei. Weitere Informationen bieten die folgenden Themen:

Registerkarte „Sortierfelder“

Die Registerkarte „Sortierfelder“ definiert Felder, nach denen die Ausgabesätze sortiert werden sollen, bevor sie in die Ausgabedatei geschrieben werden. Die Sortierung ist optional. Weitere Informationen finden Sie unter Sortieren von Ausgabedatensätzen.

Registerkarte „Laufzeit“

Name der Option

Beschreibung

Dateiname

Zeigt die auf der Registerkarte Dateieigenschaften definierte Datei an.

Mehrere Dateien generieren Wählen Sie diese Option aus, um Datensätze in unterschiedliche Dateien zu schreiben (statt alle Datensätze in eine Datei). Die Datei, in die jeder Datensatz geschrieben wird, ist im Datensatz selbst angegeben. Jeder Datensatz muss ein Feld enthalten, das entweder den Namen oder den vollständigen Pfad zu der Datei angibt, in die der Datensatz geschrieben werden soll. Wenn Sie beispielsweise die Aktienkurse verschiedener Unternehmen (verschiedener Gruppen) allen Kunden gesondert senden möchten, schreibt dieses Feature die Aktienkurse der verschiedenen Unternehmen in separate Dateien, die Sie auf Wunsch jedem der Kunden senden können. Wenn Sie die Option Mehrere Dateien generieren aktivieren, müssen Sie eine Ausgabedatei entweder auf dem Spectrum Technology Platform-Server oder einem SFTP-Server angeben. Wenn Sie Daten in eine Datei auf einem SFTP-Server schreiben möchten, müssen Sie mit Spectrum Management Console eine Verbindung zum Dateiserver definieren.
Anmerkung: Die Datensätze in der im Dateipfadfeld ausgewählten Spalte müssen sortiert vorliegen. Verwenden Sie dieses Feature, wenn der Datensatz entweder den Namen oder den vollständigen Pfad der Datei enthält.
Dateipfadfeld Wählt das Feld aus, das den Pfad (entweder ein Dateiname oder der vollständige Dateipfad) der Datei enthält, in die Sie den Datensatz schreiben möchten. Dieses Feld ist nur aktiviert, wenn Sie Mehrere Dateien generieren auswählen.

Schreibmodus

Gibt an, ob die Ausgabe des Datenflusses am Ende der Datei hinzugefügt oder ob die in der Datei vorhandenen Daten vor dem Schreiben der Ausgabe gelöscht werden sollen:

Überschreiben
Ersetzt die vorhandenen Daten in der Ausgabedatei jedes Mal, wenn der Datenfluss ausgeführt wird.
Anfügen
Fügt die Ausgabe des Datenflusses am Ende der Datei hinzu, ohne die vorhandenen Daten der Datei zu löschen.