-
Klicken Sie auf die Schaltfläche Dateipfad.
Das Popup-Fenster Datei auswählen wird angezeigt.
-
Sie gelangen über das Kästchen für die Dateipfadauswahl zum gewünschten Pfad auf dem Server.
Unter dem Kästchen für die Dateipfadauswahl wird am ausgewählten Speicherort eine Liste von Dateien angezeigt.
-
Wählen Sie die gewünschte Datei aus, und klicken Sie auf OK.
Anmerkung: Über den Filter gelangen Sie zu einer bestimmten Datei in der Liste.
-
Nehmen Sie, wie beschrieben, Änderungen in dieser Relation vor, um Einstellungen für die Datei zu ändern.
Einstellungen Beschreibung Zeichencodierung
Dies ist die Codierung der Textdatei. Wählen Sie eine der folgenden Optionen:- UTF-8
- Die Datei unterstützt alle Unicode-Zeichen und ist abwärtskompatibel mit ASCII. Weitere Informationen zu UTF finden Sie unter unicode.org/faq/utf_bom.html.
- UTF-16
- Die Datei unterstützt alle Unicode-Zeichen, ist aber nicht abwärtskompatibel mit ASCII. Weitere Informationen zu UTF finden Sie unter unicode.org/faq/utf_bom.html.
- US-ASCII
- Die Zeichencodierung basiert auf der Reihenfolge des englischen Alphabets.
- UTF-16BE
- Die Datei ist UTF-16-codiert mit Big-Endian-Reihenfolge (höchstwertiges Byte zuerst).
- UTF-16LE
- Die Datei ist UTF-16-codiert mit Little-Endian-Reihenfolge (niedrigstwertiges Byte zuerst).
- ISO-8859-1
- Dies ist eine ASCII-Zeichencodierung, die normalerweise für westeuropäische Sprachen verwendet wird. Sie ist auch bekannt als Latin-1.
- ISO-8859-2
- Dies ist eine ASCII-Zeichencodierung, die normalerweise für osteuropäische Sprachen verwendet wird. Sie ist auch bekannt als Latin-2.
- ISO-8859-3
- Dies ist eine ASCII-Zeichencodierung, die normalerweise für südeuropäische Sprachen verwendet wird. Sie ist auch bekannt als Latin-3.
- ISO-8859-9
- Dies ist eine ASCII-Zeichencodierung, die normalerweise für Türkisch verwendet wird. Sie ist auch bekannt als Latin-5.
- CP850
- Dies ist eine ASCII-Codeseite, die für westeuropäische Sprachen verwendet wird.
- CP500
- Dies ist eine EBCDIC-Codeseite, die für westeuropäische Sprachen verwendet wird.
- Shift_JIS
- Dies ist eine Zeichencodierung für Japanisch.
- MS932
- Dies ist eine Shift_JIS-Erweiterung von Microsoft, die besondere NEC-Zeichen, eine NEC-Auswahl aus IBM-Erweiterungen und IBM-Erweiterungen einschließt.
Feldtrennzeichen Gibt das Zeichen an, das zum Trennen von Feldern in einer Datei mit Begrenzungszeichen verwendet wird.
Im folgenden Beispiel wird ein Pipe-Zeichen ( | ) im Datensatz als Feldtrennzeichen verwendet:
7200 13TH ST|MIAMI|FL|33144
Die folgenden Zeichen stehen als Feldtrennzeichen zur Verfügung:
- Komma
- Semikolon
- Pipe
- Tabstopp
- Leerzeichen
- Punkt
Sie können auch benutzerdefinierte Feldtrennzeichen hinzufügen. Führen Sie die folgenden Schritte aus, um ein benutzerdefiniertes Feldtrennzeichen hinzuzufügen:- Klicken Sie auf die Schaltfläche „Hinzufügen“ neben Feldtrennzeichen. Das Popup-Fenster Trennzeichen hinzufügen wird angezeigt.
- Geben Sie in das Feld Zeichen das gewünschte Feldtrennzeichen ein. Das entsprechende Unicode-Zeichen wird dann automatisch angezeigt.
- Geben Sie in das Feld Name einen passenden Namen für Ihr Trennzeichen ein.
- Klicken Sie auf Speichern. Ihr Trennzeichen wird in der Dropdown-Liste Feldtrennzeichen angezeigt.
Textbegrenzungszeichen Dies ist das Zeichen, das in einer Datei mit Begrenzungszeichen Textwerte umschließt.
Im folgenden Beispiel werden im Datensatz doppelte Anführungszeichen (") als Textbegrenzungszeichen verwendet.
"7200 13TH ST"|"MIAMI"|"FL"|"33144"
Die folgenden Zeichen stehen zur Definition als Textbegrenzungszeichen zur Verfügung:
- Einfache Anführungszeichen (')
- Doppelte Anführungszeichen (")
Zeilentrennzeichen Gibt das Zeichen an, das zum Trennen von Datensätzen einer Zeile in sequenziellen Datei oder einer Datei mit Begrenzungszeichen verwendet wird. Die verfügbaren Einstellungen für Datensatz-Trennzeichen sind:
- Unix (U+000A)
- Die Datensätze sind durch ein Zeilenvorschubzeichen getrennt. Dies ist bei Unix-Systemen das standardmäßige Datensatz-Trennzeichen.
- Macintosh (U+000D)
- Die Datensätze sind durch ein Zeilenumbruchzeichen getrennt. Dies ist bei Macintosh-Systemen das standardmäßige Datensatz-Trennzeichen.
- Windows (U+000D U+000A)
- Die Datensätze sind durch ein Zeilenumbruchzeichen gefolgt von einem Zeilenvorschubzeichen getrennt. Dies ist bei Windows-Systemen das standardmäßige Datensatz-Trennzeichen.
Erste Zeile als Kopfzeile Gibt an, ob der erste Datensatz in einer Datei mit Begrenzungszeichen Überschriften enthält. Ein Ja zeigt an, dass Überschriften vorhanden sind.
Im folgenden Dateiausschnitt ist der erste Datensatz ein Kopfzeilen-Datensatz.
"AddressLine1"|"City"|"StateProvince"|"PostalCode" "7200 13TH ST"|"MIAMI"|"FL"|"33144" "One Global View"|"Troy"|"NY"|12180
-
Klicken Sie auf Speichern und fortfahren, um Ihre Änderungen zu speichern.
Sie können jetzt Spalten für Ihre Regel auswählen.
Auf dieser Seite können Sie eine Quelldatei auswählen, die die Gruppe von Datensätzen enthält, z. B. die Sammlungsnummer. Die Datensätze mit der gleichen Sammlungsnummer bilden dabei eine Gruppe. Auf dieser Seite können Sie entweder dieselbe Quelle auswählen, indem Sie die Schaltfläche Wie Quelle auf Ja umschalten, oder eine andere Quelldatei auswählen, wie nachfolgend erläutert.
Anmerkung: Es wird empfohlen, eine Datei mit Datensatzdubletten auszuwählen und sicherzustellen, dass die eindeutigen Datensätze herausgefiltert werden. Sie können hier auch die Ausgabe Ihres Vergleichs als Eingangsquelle verwenden.