date
“ als String
-Werte. Dieses Verhalten beruht auf dem von Spectrum verwendeten Standardtreiber, dem jTDS-Treiber. Um alle date
-Datentypenwerte unverändert zu verarbeiten, verwenden Sie den JDBC-Treiber von Microsoft.- Konnektivität zu Hive von Spectrum auf Windows
- Unterstützung von und Konnektivität zu Hive-Version 2.1.1 von Spectrum mit hoher Verfügbarkeit
- Unterstützung für das Lesen und Schreiben aus der Hive-DB (JDBC) über eine Model Store-Verbindung
Siehe auch Best Practices für die Verbindung mit HDFS 3.x und Hive 2.1.1.
Konfigurieren der Registerkarte „Allgemein“
- Wählen Sie aus der Dropdown-Liste Verbindung die Verbindung für die Datenbank aus, die Sie verwenden möchten.
- Klicken Sie auf Verwalten, um eine neue Datenbankverbindung herzustellen. Weitere Informationen zum Erstellen von Datenbankverbindungen finden Sie unter Datenbankverbindungs-ManagerAnmerkung: Diese Option ist nur über den Spectrum Enterprise Designer verfügbar.
- Um eine Relation oder Ansicht aus der Datenbank auszuwählen, klicken Sie auf die Schaltfläche „Durchsuchen“ und wählen Sie die Relation oder Ansicht, die Sie verwenden möchten.
Wenn Sie eine Relation durchsuchen und auswählen, wird das Relationsschema mit Datenbankfeldern, Schrittfeldern und Datentypen angezeigt. Eine Vorschau der Relation ist ebenfalls verfügbar.
Anmerkung: Wenn Sie in eine SQL-Datenbank schreiben, können Sie nicht in Ansichten schreiben, die mehr als eine Relation referenzieren. Das liegt an einer Einschränkung von SQL Server. - Um eine neue Relation in der Datenbank zu erstellen, klicken Sie auf Relation erstellen , wählen Sie im erscheinenden Popup-Fenster den Relationsbesitzer aus und geben Sie den Relationsnamen an. Anmerkung: Bei Relationsnamen wird die Groß-/Kleinschreibung beachtet.Anmerkung: Wenn Sie keinen Eingabeschritt (wie Read from File oder Read from DB) besitzen, der mit dem Schritt Write to DB verknüpft ist, erhalten Sie die folgende Fehlermeldung: Zum Erstellen einer Relation muss ein Relationsschema definiert sein. Bitte stellen Sie sicher, dass Sie für diesen Schritt Upstream-Felder definiert haben.
- Geben Sie im Relationsschema folgendes Details an:
- Geben Sie den Primärschlüssel an, indem Sie das entsprechende Kontrollkästchen Primärschlüssel aktivieren.
- Aktivieren Sie das Kontrollkästchen Einschließen, um die Felder anzugeben, die Sie in die neue Relation schreiben möchten.
- Geben Sie für den Datentyp „Zeichenfolge“ die Länge der Felder in der Spalte Breite an. Anmerkung: Der Standardwert ist 512.
- Falls Null zulassen aktiviert ist und die Eingabefelder einen Nullwert enthalten, schreibt der Datenfluss den Nullwert in die Datenbank.
- Beachten Sie, dass Sie den Spaltennamen bearbeiten können, indem Sie die entsprechenden Eingabefeldern ändern.
Die Schaltfläche Relation erstellen unterstützt die Relationserstellung in den folgenden Datenbanken:
- Axion
- DB2
- Derby oder Cloudscape
- Firebird
- HSQLDB
- Interbase
- MaxDB oder SapDB
- McKoi
- MySQL
- Oracle
- PostgreSQL
- SQL Server
- Sybase
Anmerkung: Für DB2-Datenbanken gilt: Wenn Sie versuchen, eine Relation zu erstellen und die Seitengröße kleiner als die Gesamtlänge aller Zeichenfolgenspalten ist, erhalten Sie die Fehlermeldung „Fehler beim Erstellen von Text aus Inhalt. Serialisierbare Klasse nicht für Broker verfügbar.“ - Klicken Sie auf die Schaltfläche OK, um das Popup-Fenster Relation erstellen zu schließen und zu „Write to DB“-Optionen zurückzukehren.
- In der Spalte Schrittfelder des Relationsschemas können Sie den Feldnamen angeben, den Sie in die Datenbank schreiben möchten, die der Spalte Datenbankfeld entspricht.
- Aktivieren Sie das Kontrollkästchen „Einschließen“, um die Felder auszuwählen, die Sie schreiben möchten.Anmerkung: Um schlechte Leistung zu verhindern, sollte ein sortierter Index oder Schlüssel in der Datenbankrelation vorhanden sein.
Konfiguration der Registerkarte „Laufzeit“
Name der Option |
Beschreibung |
---|---|
Schreibmodus |
Gibt eine Aktion an, die beim Schreiben in die Datenbank durchgeführt werden soll:
|
Übergabe als Batch |
Wählen Sie diese Option aus, um Änderungen an die Datenbank zu übergeben, nachdem eine angegebene Anzahl von Datensätzen verarbeitet wurde. Standardmäßig ist diese Option nicht ausgewählt, was bedeutet, dass Änderungen sofort übergeben werden, nachdem ein jeder Datensatz verarbeitet wurde. Durch Auswahl dieser Option kann sich die Leistung des „Write to DB“-Schrittes erheblich verbessern. |
Batch-Größe |
Wenn Sie die Option Übergabe als Batch aktivieren, geben Sie damit die Anzahl von Datensätzen an, die in jedem Batch an die Datenbank übergeben werden sollen. Der Standardwert ist 1.000. Bei mit Spectrum Technology Platform 7.0 und älter erstellten Datenflüssen ist der Standardwert 100. Eine größere Batchgröße bietet nicht immer eine bessere Leistung beim Laden. Berücksichtigen Sie die folgenden Faktoren, wenn Sie eine Batchgröße auswählen:
|
Am Ende übergeben | Wählen Sie diese Option aus, um sicherzustellen, dass die Übergabeoperation für die Datenbank ausgeführt wird, nachdem alle Datensätze an die Datenbank übertragen wurden. |
Anzahl zu übergebender Batches | Geben Sie einen Wert an, bei dessen Erreichen die Datensätze übergeben werden sollen. Datensätze werden immer dann an die Datenbank übergeben, wenn (Anzahl zu übergebender Batches * Batchgröße) Datensätze an die Datenbank übertragen wurden. Beispiel: Wenn Batchgröße auf 1.000 und Anzahl zu übergebender Batches auf 3 gesetzt ist, erfolgt die Übergabe immer, nachdem 3.000 Datensätze an die Datenbank übertragen wurden. |
Relation vor dem Einfügen von Daten abschneiden |
Wählen Sie diese Option aus, wenn Sie vor dem Schreiben in die Datenbank alle Daten aus der Relation löschen möchten. |
Relation löschen und neu erstellen, wenn sie bereits vorhanden ist |
Wählen Sie diese Option aus, um die Relation vor dem Schreiben der Ausgabe des Datenflusses in die Relation zu löschen und erneut zu erstellen. Diese Option ist nützlich, wenn Sie möchten, dass das Schema der Relation mit den Feldern aus dem Datenfluss übereinstimmt und keine fremden Schemadaten enthält. Die Relation, die gelöscht und erneut erstellt wird, ist die Relation, die im Feld Relation/Ansicht auf der Registerkarte Allgemein angegeben ist. Beispiel: Wenn Sie die Relation „Customers“ im Feld Relation/Ansicht angeben und Relation löschen und neu erstellen, wenn sie bereits vorhanden ist auswählen, wird die Relation „Customers“ aus der Datenbank gelöscht und eine neue Relation namens „Customers“ erstellt – mit einem Schema, das genau den in die Relation geschriebenen Feldern entspricht. |