Aktualisieren einer Faktentabelle - spectrum_platform - 23 - 23.1

Spectrum Enterprise Data Integration-Handbuch

Product type
Software
Portfolio
Integrate
Product family
Spectrum
Product
Spectrum > Data Integration
Version
23.1
Language
Deutsch
Product name
Spectrum Data Integration
Title
Spectrum Enterprise Data Integration-Handbuch
First publish date
2005
Last updated
2023-10-25
Published on
2023-10-25T06:22:15.743462

Diese Schritte beschreiben, wie Sie einen Datenfluss erstellen können, der Daten aus einer Quelldatenbank oder einer Datei liest und eine Faktentabelle in Ihrem Data Warehouse mit diesen Daten aktualisiert.

  1. Wählen Sie in Enterprise Designer die Menüoptionen Datei > Neu > Datenfluss > Auftrag aus.
  2. Ziehen Sie, je nach Quelle der Daten, die Sie in die Faktentabelle schreiben möchten, den entsprechenden Schritt auf die Arbeitsfläche.
    • Um Daten aus einer Datenbank zum Füllen der Relation zu verwenden, ziehen Sie den Read from DB-Schritt auf die Arbeitsfläche.
    • Um Daten aus einem Flatfile zum Füllen der Relation zu verwenden, ziehen Sie den Read from File-Schritt auf die Arbeitsfläche.
    • Um Daten aus einer Datei mit variablem Format zum Füllen der Relation zu verwenden, ziehen Sie den Read from Variable Format File-Schritt auf die Arbeitsfläche.
    • Um Daten aus einer XML-Datei zum Füllen der Relation zu verwenden, ziehen Sie den Read from XML-Schritt auf die Arbeitsfläche.
    Anmerkung: Wenn Sie Daten aus einer Datei und nicht aus einer Datenbank lesen, vergewissern Sie sich, dass die Datei nur die Datensätze enthält, die Sie zur Faktentabelle hinzufügen möchten, und keine Datensätze enthält, die bereits in der Faktentabelle vorhanden sind. Wenn Sie Daten aus einer Datenbank lesen, definieren Sie später in dieser Prozedur eine Abfrage zur Filterung der Datensätze.
  3. Doppelklicken Sie auf den Quellschritt, den Sie gerade auf der Arbeitsfläche platziert haben, und konfigurieren Sie ihn, auf die Quelle der Daten zu verweisen, mit denen Sie die Faktentabelle füllen möchten.
    • Weitere Informationen zum Konfigurieren des „Read from DB“-Schrittes finden Sie unter Read from DB.
    • Weitere Informationen zum Konfigurieren des „Read from File“-Schrittes finden Sie unter Read from File.
    • Weitere Informationen zum Konfigurieren des „Read from Variable Format File“-Schrittes finden Sie unter Read from Variable Format File.
    • Weitere Informationen zum Konfigurieren des „Read from XML“-Schrittes finden Sie unter Read from XML.
  4. Wenn Sie Daten aus einer Datenbank lesen, filtern Sie die Datensätze, sodass nur neue Datensätze zur Faktentabelle hinzugefügt werden. Sie erreichen dies, indem Sie die SQL SELECT-Anweisung definieren, nur Datensätze einzulesen, die seit der letzten Aktualisierung der Faktentabelle geändert wurden.
  5. Ziehen Sie einen Broadcaster-Schritt auf die Arbeitsfläche und verbinden Sie ihn mit dem Quellschritt.
    Ihr Datenfluss sieht nun folgendermaßen aus:

  6. Ziehen Sie für jede Dimensionstabelle in Ihrem Data Warehouse einen „Query DB“-Schritt auf die Arbeitsfläche und verbinden Sie ihn mit dem Broadcaster-Schritt.
    Wenn Sie in Ihrem Data Warehouse beispielsweise über vier Dimensionstabellen verfügen, ziehen Sie vier „Query DB“-Schritte auf die Arbeitsfläche. Ihr Datenfluss würde folgendermaßen aussehen:

    Die „Query DB“-Schritte werden verwendet, um den Surrogatschlüssel für jede Dimension über den normalen Schlüssel aus der Datenquelle zu suchen. Der Surrogatschlüssel ersetzt dann den normalen Schlüssel in jedem Datensatz, der in die Faktentabelle geladen wird.

    Tipp: Sie können den Namen des Schrittes ändern, um einfacher zu sehen, welche Tabelle von einem Schritt abgefragt wird.
  7. Konfigurieren Sie jeden „Query DB“-Schritt, den Surrogatschlüssel für jeden normalen Schlüssel in der Datenquelle zu suchen. Gehen Sie dazu wie folgt vor:
    1. Geben Sie im Feld Verbindung die Verbindung zum Data Warehouse an.
    2. Wählen Sie im Feld Tabelle/Ansicht: die Dimensionstabelle aus, die Sie über diesen Schritt abfragen möchten.
    3. Geben Sie im Feld Where eine WHERE-Anweisung ein, die den Surrogatschlüssel basierend auf dem Wert im entsprechenden Datenflussfeld sucht.

      Das folgende Beispiel sucht den Surrogatschlüssel für ein Produkt, indem nach dem Datensatz in der Dimensionstabelle gesucht wird, dessen Wert in der Spalte description mit dem Wert im Feld product_name der Datenquelle übereinstimmt.

      description=${product_name}
    4. Wählen Sie in der Spalte Einschließen die Datenbankspalte aus, die den Surrogatschlüssel enthält.

    Ein „Query DB“-Schritt, der den Surrogatschlüssel für einen Produktnamen sucht, würde beispielsweise folgendermaßen aussehen:

    In diesem Beispiel sucht die Abfrage den Produktschlüssel, indem sie nach dem Datensatz in der Tabelle prod_dimension sucht, bei dem der Wert in der Spalte description mit dem Wert im Datenflussfeld product_name übereinstimmt. Der Schritt gibt das Feld product_key aus der Tabelle zurück und fügt es dem Datenfluss hinzu, wie das aktivierte Kästchen in der Spalte Einschließen anzeigt.

  8. Ziehen Sie einen „Record Combiner“-Schritt auf die Arbeitsfläche und verbinden Sie alle „Query DB“-Schritte mit diesem.

    Ihr Datenfluss sollte nun folgendermaßen aussehen:



  9. Ziehen Sie einen „Write to DB“-Schritt auf die Arbeitsfläche und verbinden Sie ihn mit dem „Record Combiner“-Schritt.
    Ihr Datenfluss sollte nun folgendermaßen aussehen:

  10. Konfigurieren Sie den „Write to DB“-Schritt, die Datensätze in die Faktentabelle zu schreiben. Gehen Sie dazu wie folgt vor:
    1. Geben Sie im Feld Verbindung die Verbindung zum Data Warehouse an.
    2. Wählen Sie im Feld Tabelle/Ansicht: die Faktentabelle aus, die Sie über diesen Schritt abfragen möchten. Wenn die Faktentabelle noch nicht im Data Warehouse vorhanden ist, klicken Sie auf Tabelle erstellen, um die Faktentabelle im Data Warehouse zu erstellen.
    3. Aktivieren Sie für jedes Feld, das Sie in die Faktentabelle schreiben möchten, das Kästchen in der Spalte Einschließen.
    4. Beachten Sie, dass auf der Registerkarte Laufzeit standardmäßig Einfügen als Option für den Schreibmodus ausgewählt ist. Normalerweise wird die Faktentabelle im Einfügemodus gefüllt, Sie können diese Option daher ausgewählt lassen.