Der Schritt Read from File gibt eine Eingabedatei für einen Auftrag oder Unterfluss an. Er steht nicht für Dienste zur Verfügung.
- Erstellen Sie mithilfe der Spectrum Management Console oder Discovery eine Verbindung zu diesen Dateiservern. Weitere Details finden Sie im Abschnitt Definieren von Verbindungen.
- Wählen Sie die Datei mithilfe des Feldes Dateiname auf der Registerkarte Dateieigenschaften aus (siehe unten).
Registerkarte „Dateieigenschaften“
Feldname | Beschreibung |
---|---|
Servername | Dies gibt an, ob sich die von Ihnen als Eingabe ausgewählte Datei auf dem Computer mit dem Spectrum Enterprise Designer oder auf dem Spectrum Technology Platform-Server befindet. Wenn Sie eine Datei auf dem lokalen Computer auswählen, lautet der Servername „Arbeitsplatz“. Wenn Sie eine Datei auf dem Server auswählen, lautet der Servername Spectrum Technology Platform. |
Dateiname | Gibt den Pfad zur Datei an. Klicken Sie auf die Ellipsenschaltfläche (...), um zur gewünschten Datei zu navigieren. Sie können ein Platzhalterzeichen verwenden, um Daten aus mehreren Dateien im Verzeichnis einzulesen. Die Platzhalterzeichen * und ? werden unterstützt. Sie können beispielsweise *.csv eingeben, um alle Dateien mit der Erweiterung Beim Lesen einer Datei von einen HDFS-Dateiserver werden die folgenden Komprimierungsformate unterstützt:
Anmerkung: Die Erweiterung der Datei zeigt das zum Extrahieren zu verwendende Komprimierungsformat an.
Achtung: Falls der Spectrum Technology Platform-Server unter Linux ausgeführt wird, sollten Sie berücksichtigen, dass bei Dateinamen und Pfaden auf diesen Plattformen die Groß-/Kleinschreibung beachtet wird.
|
Datensatztyp | Dies ist das Format der Datensätze in der Datei. Wählen Sie eine Option:
|
Zeichencodierung | Dies ist die Codierung der Textdatei. Weitere Informationen finden Sie unter Zeichencodierungen. |
Feldtrennzeichen | Gibt das Zeichen an, das zum Trennen von Feldern in einer Datei mit Begrenzungszeichen verwendet wird. Im folgenden Beispiel wird ein Pipe-Zeichen ( | ) im Datensatz als Feldtrennzeichen verwendet:
Die folgenden Zeichen stehen zur Definition als Feldtrennzeichen zur Verfügung:
Wenn in der Datei ein anderes Zeichen als Feldtrennzeichen verwendet wird, klicken Sie auf die Ellipsenschaltfläche, um ein anderes Zeichen als Begrenzungszeichen auszuwählen. |
Textbegrenzungszeichen | Dies ist das Zeichen, das in einer Datei mit Begrenzungszeichen Textwerte umschließt. Im folgenden Beispiel werden im Datensatz doppelte Anführungszeichen (") als Textbegrenzungszeichen verwendet. Die folgenden Zeichen stehen zur Definition als Textbegrenzungszeichen zur Verfügung:
Wenn in der Datei ein anderes Textbegrenzungszeichen verwendet wird, klicken Sie auf die Ellipsenschaltfläche, um ein anderes Zeichen als Textbegrenzungszeichen auszuwählen. |
Datensatz-Trennzeichen | Gibt das Zeichen an, das zum Trennen von Datensätzen in einer zeilensequenziellen Datei oder einer Datei mit Begrenzungszeichen verwendet wird. Dieses Feld ist nicht verfügbar, wenn Sie das Kästchen Standard-Zeilenende verwenden aktivieren. Die verfügbaren Einstellungen für Datensatz-Trennzeichen sind:
Wenn in der Datei ein anderes Datensatz-Trennzeichen verwendet wird, klicken Sie auf die Ellipsenschaltfläche, um ein anderes Zeichen als Datensatz-Trennzeichen auszuwählen. |
Standard-Zeilenende verwenden | Gibt an, dass das standardmäßige Zeilenendzeichen (EOL) des Betriebssystems, auf dem der Spectrum Technology Platform-Server läuft, als Datensatz-Trennzeichen der Datei verwendet wird. Wählen Sie diese Option nicht aus, wenn in der Datei ein Zeilenendzeichen verwendet wird, das sich vom standardmäßigen Zeilenendzeichen des Betriebssystems des Servers unterscheidet. Wenn in der Datei beispielsweise ein Windows-Zeilenendzeichen verwendet wird, der Server aber auf Linux läuft, aktivieren Sie diese Option nicht. Wählen Sie stattdessen im Feld Datensatz-Trennzeichen die Option „Windows“ aus. |
Datensatzlänge | Geben Sie bei Dateien an, die Datensätze mit fester Breite enthalten, die genaue Anzahl von Zeichen jedes Datensatzes. Geben Sie bei zeilensequenziellen Dateien die Länge des längsten Datensatzes in der Datei in Zeichen an. |
Erste Zeile ist Kopfzeilen-Datensatz | Gibt an, ob der erste Datensatz in einer Datei mit Begrenzungszeichen Überschriften und keine Daten enthält. Im folgenden Dateiausschnitt ist der erste Datensatz ein Kopfzeilen-Datensatz. |
Datensätze mit weniger Feldern als in der Definition als falsch formatiert behandeln | Datensätze in Dateien mit Begrenzungszeichen, die weniger Felder enthalten, als auf der Registerkarte Felder definiert wurden, werden als falsch formatiert behandelt. |
Importieren | Dies importiert die Definition des Dateilayouts, die Codierungseinstellung und Sortieroptionen aus einer Einstellungsdatei. Die Einstellungsdatei wird beim Exportieren von Einstellungen durch einen anderen „Read from File“- oder „Write to File“-Schritt erstellt. Dieser verwendet dieselbe Eingabedatei oder eine Datei, die über dasselbe Layout wie die Datei verfügt, mit der Sie arbeiten. |
Exportieren | Dies exportiert die Definition des Dateilayouts, die Codierungseinstellung und Sortieroptionen in eine Einstellungsdatei. Sie können anschließend diese Einstellungen in andere „Read from File“- oder „Write to File“-Schritte importieren, die dieselbe Eingabedatei oder eine Datei mit demselben Layout wie die Datei verwenden, mit der Sie gerade arbeiten. Sie können die Einstellungsdatei auch mit dem Job Executor verwenden, um die Dateieinstellungen zur Laufzeit anzugeben. Informationen zur Einstellungsdatei finden Sie unter Die Dateidefinitions-Einstellungsdatei. |
Registerkarte „Felder“
Die Registerkarte „Felder“ definiert die Namen, Positionen und, bei Dateien vom Typ „Feste Breite“ und „Zeilensequenziell“, die Länge der Felder in der Datei. Weitere Informationen bieten die folgenden Themen:
Registerkarte „Sortierfelder“
Die Registerkarte „Sortierfelder“ definiert Felder, nach denen die Eingabedatensätze sortiert werden sollen, bevor sie in den Datenfluss gesendet werden. Die Sortierung ist optional. Weitere Informationen finden Sie unter Sortieren von Eingabedatensätzen.
Registerkarte „Laufzeit“
Feldname | Beschreibung |
---|---|
Dateiname |
Zeigt den auf der ersten Registerkarte ausgewählten Dateinamen an. |
Startdatensatz |
Wenn Sie beim Einlesen der Datensätze in den Datenfluss Datensätze am Anfang der Datei überspringen möchten, geben Sie hier den ersten Datensatz an, der gelesen werden soll. Wenn Sie beispielsweise die ersten 50 Datensätze in einer Datei überspringen möchten, geben Sie 51 ein. Der 51. Datensatz ist dann der erste Datensatz, der in den Datenfluss eingelesen wird. |
Alle Datensätze |
Wählen Sie diese Option aus, wenn Sie alle Datensätze ab dem im Feld Startdatensatz definierten Datensatz bis zum Ende der Datei einlesen möchten. |
Max. Anzahl Datensätze |
Wählen Sie diese Option aus, wenn Sie nur eine bestimmte Anzahl von Datensätzen ab dem im Feld Startdatensatz angegebenen Datensatz einlesen möchten. Wenn Sie beispielsweise die ersten 100 Datensätze einlesen möchten, wählen Sie diese Option aus und geben Sie 100 an. |