Diese Datenflussvorlage zeigt, wie Interessentendaten einer Eingabedatei für Kundendaten in einer Kundendatenbank bewertet werden, um zu bestimmen, ob ein Interessent ein Kunde ist. Dies ist ein Dienstdatenfluss, d. h. dass der Datenfluss über die API oder Webservices zugänglich ist.
Geschäftsszenario
Als Verkaufsleiter eines Onlinehandel-Unternehmens möchten Sie herausfinden, ob ein potenzieller Onlinekunde ein Bestandskunde oder ein Neukunde ist.
Der folgende Datenflussdienst bietet eine Lösung für das Geschäftsszenario:
Diese Datenflussvorlage ist im Enterprise Designer verfügbar. Öffnen Sie ProspectMatching aus. Dieser Datenfluss erfordert die folgenden Produkte: Advanced Matching und Universal Name.
, und wählen SieFür jeden Datensatz in der Eingabedatei führt dieser Datenfluss Folgendes aus:
Eingabe
Die ausgewählten Eingabefelder für diese Vorlage sind „AddressLine1“, „City“, „Name“, „PostalCode“ und „StateProvince“. „AddressLine1“ und „Name“ sind die Felder, die für die Datenflussverarbeitung in dieser Vorlage entscheidend sind.
Name Parser
In dieser Vorlage ist der „Name Parser“-Schritt als „Parse Personal Name“ benannt. Der „Parse Personal Name“-Schritt untersucht Namensfelder und vergleicht sie mit den Namensdaten, die in den Namensdatenbankdateien von Spectrum Technology Platform gespeichert sind. Basierend auf dem Vergleich parst er die Namensdaten in den Feldern „Vorname“, „Zweiter Vorname“ und „Nachname“ und weist jedem Namen einen Entitätstyp sowie ein Geschlecht zu. Er verwendet neben den Namensdaten außerdem die Mustererkennung.
In dieser Vorlage wird der „Parse Personal Name“-Schritt wie folgt konfiguriert.
- „Personennamen parsen“ wird ausgewählt und „Unternehmensnamen parsen“ wird gelöscht. Bei der Auswahl dieser Optionen werden Vornamen nach Geschlecht, Reihenfolge und Interpunktion ausgewertet und es wird keine Bewertung der Unternehmensnamen durchgeführt.
- „Quelle für Geschlechtsbestimmung“ ist auf „Standard“ eingestellt. In den meisten Fällen ist „Standard“ die beste Einstellung für die Geschlechtsbestimmung, da mit ihr ein breites Spektrum von Namen abgedeckt wird. Wenn Sie jedoch Namen aus einer bestimmten Kultur verarbeiten, wählen Sie diese Kultur aus. Die Auswahl einer bestimmten Kultur hilft bei der Sicherstellung, dass den Namen das richtige Geschlecht zugewiesen wird. Beispiel: Wenn Sie „Standard“ aktiviert lassen, wird der Name Jean als weiblicher Name identifiziert. Wenn Sie jedoch Französisch auswählen, wird der Name als männlicher Name identifiziert.
- „Reihenfolge“ ist auf „Natürlich“ eingestellt. Die Namensfelder sind nach Titel, Vorname, zweiter Vorname, Nachname und Suffix sortiert.
- „Punkte beibehalten“ ist deaktiviert. Das heißt, dass keinerlei Interpunktion in den Namensdaten beibehalten wird.
Candidate Finder
Der „Candidate Finder“-Schritt wird zur Kombination mit dem „Transactional Match“-Schritt verwendet.
Im „Candidate Finder“-Schritt werden die Kandidatendatensätze abgerufen, die die Gruppe potenzieller Übereinstimmungen bilden, die im „Transactional Match“-Schritt ausgewertet wird. Zusätzlich muss je nach Format Ihrer Daten „Candidate Finder“ gegebenenfalls auch den Namen oder die Adresse des Kopfdubletten-Datensatzes, der Kandidatendatensätze oder beides parsen.
Wählen Sie als Teil der Konfiguration von „Candidate Finder“ die Datenbankverbindung aus, über die die angegebene Abfrage ausgeführt werden soll. Sie können eine beliebige, auf der Management Console konfigurierte Verbindung auswählen. Um eine nicht aufgeführte Datenbank zu verbinden, müssen Sie in der Management Console eine Verbindung zu dieser Datenbank konfigurieren, und anschließend „Candidate Finder“ schließen und erneut öffnen, um die Liste der Verbindungen zu aktualisieren.
Zur Definition einer SQL-Abfrage können Sie eine beliebige gültige SQL SELECT-Anweisung in das Textfeld im Dialogfeld „‚Candidate Finder‘-Optionen“ eingeben. Angenommen, Sie haben eine Tabelle mit Namen „Customer_Table“ in Ihrer Datenbank, die die folgenden Spalten aufweist:
Customer_Table |
Cust_Name |
Cust_Address |
Cust_City |
Cust_State |
Cust_Zip |
Um alle Zeilen aus der Datenbank abzurufen, könnten Sie eine Abfrage ähnlich der folgenden erstellen:
select Cust_Name, Cust_Address, Cust_City, Cust_State, Cust_Zip from Customer_Table;
Es ist jedoch unwahrscheinlich, dass Sie Ihre Transaktion mit allen Zeilen der Datenbank vergleichen möchten. Um nur relevante Kandidatendatensätze zurückzugeben, müssten Sie eine WHERE-Klausel mithilfe einer Variablenersetzung hinzufügen. Eine Variablenersetzung ist eine besondere Notation, mit der die Candidate Selection-Engine die Variable mit den tatsächlichen Daten aus Ihrem Kopfdubletten-Datensatz ersetzt.
Um die Variablenersetzung zu verwenden, schließen Sie den Feldnamen in geschweiften Klammern ein, denen Sie ein Dollarzeichen voranstellen: ${Feldname}. Beispiel: Die folgende Abfrage gibt nur Datensätze mit einem Wert in „Cust_Zip“ zurück, der mit dem Wert in „PostalCode“ im Kopfdubletten-Datensatz übereinstimmt.
select Cust_Name, Cust_Address, Cust_City, Cust_State,Cust_Zip from Customer_Table where Cust_Zip = ${PostalCode};
Als nächstes müssen Sie die Datenbankspalten den Schrittfeldern zuordnen, wenn die Spaltennamen in Ihrer Datenbank nicht genau mit den „Component Field“-Namen übereinstimmen. Wenn sie nicht übereinstimmen, werden sie automatisch den entsprechenden Schrittfeldern zugeordnet. Sie müssen „Ausgewählte Felder“ (Spalten aus der Datenbank) verwenden, um sie den Schrittfeldern (im Datenfluss definierte Feldnamen) zuzuordnen.
Berücksichtigen Sie erneut „Customer_Table“ aus dem obigen Beispiel:
Customer_Table |
Cust_Name |
Cust_Address |
Cust_City |
Cust_State |
Cust_Zip |
Wenn Sie diese Datensätze aus der Datenbank abrufen, müssen Sie die Spaltennamen den Feldnamen zuordnen, die durch den „Transactional Match“-Schritt und andere Schritte in Ihrem Datenfluss verwendet werden. So könnte beispielsweise „Cust_Address“ „AddressLine1“ und „Cust_Zip“ „PostalCode“ zugeordnet werden.
- Wählen Sie in der Ansicht „‚Candidate Finder‘-Optionen“ die Dropdown-Liste unter Ausgewählte Felder aus. Wählen Sie danach die Datenbankspalte „Cust_Zip“ aus.
- Wählen Sie die Dropdown-Liste unter Schrittfelder aus. Wählen Sie danach das Feld aus, das Sie zuordnen möchten.
Wenn Sie beispielsweise „Cust_Zip“ „Postal Code“ zuordnen möchten, wählen Sie zuerst „Cust_Zip“ unter „Ausgewählte Felder“ und dann „PostalCode“ in der entsprechenden Zeile „Schrittfeld“ aus.
Zusätzlich zum Zuordnen von Feldern wie oben beschrieben können Sie die spezielle Notation in Ihrer SQL-Abfrage nutzen, um die Zuordnung durchzuführen. Geben Sie dazu den Namen des Schrittfeldes in Klammern nach dem Spaltennamen in die Abfrage ein. Dabei werden die ausgewählten Felder automatisch den entsprechenden Schrittfeldern zugeordnet.
Hier folgt ein Beispiel unter Anwendung der Abfrage aus dem vorherigen Beispiel:
select Cust_Name {Name}, Cust_Address {AddressLine1}, Cust_City {City}, Cust_State {StateProvince}, Cust_Zip {PostalCode} from Customer where Cust_Zip = ${PostalCode};
Transactional Match
Der „Transactional Match“-Schritt wird zur Kombination mit dem „Candidate Finder“-Schritt verwendet.
Mit dem „Transactional Match“-Schritt können Sie Kopfdubletten-Datensätze mit Kandidatendatensätzen vergleichen, die vom „Candidate Finder“-Schritt zurückgegeben werden.
„Transactional Match“ verwendet Vergleichsregeln, um den Kopfdubletten-Datensatz mit allen Kandidatendatensätzen mit derselben (durch Candidate Finder zugewiesenen) Kandidatengruppennummer zu vergleichen, um Dubletten zu finden. Wenn es sich bei dem Kandidatendatensatz um eine Dublette handelt, wird ihm eine Sammlungsnummer zugewiesen, der übereinstimmende Datensatztyp wird als eine Dublette gekennzeichnet und der Datensatz wird anschließend ausgeschrieben. Allen Kandidaten in der Gruppe ohne Übereinstimmung wird die Sammlungsnummer 0 zugewiesen und sie werden als eindeutig markiert und ebenfalls ausgeschrieben.
Mit dieser Vorlage erstellen Sie eine benutzerdefinierte Vergleichsregel, die „LastName“ und „AddressLine1“ vergleicht.
Hier sind einige Richtlinien zur Erstellung Ihrer Vergleichshierarchie:
- Ein übergeordneter Knoten muss einen eindeutigen Namen haben. Es darf kein Feld sein.
- Das untergeordnete Feld muss ein Spectrum Technology Platform-Datentypfeld sein. Das heißt, das es durch eine oder mehrere Schritte verfügbar ist.
- Alle untergeordneten Elemente unter einem übergeordneten Element müssen dieselben logischen Operatoren verwenden. Zur Kombination von Connectors müssen Sie zunächst übergeordnete Zwischenknoten erstellen.
- Schwellenwerte übergeordneter Elemente können nicht größer sein als die der untergeordneten Elemente.
- Übergeordnete Knoten müssen keinen Schwellenwert aufweisen.
Ausgabe
Als Dienst schickt diese Vorlage alle verfügbaren Felder zur Ausgabe. Sie können die Ausgabe basierend auf Ihren Bedürfnissen eingrenzen.