In diesem Thema werden Zeichencodierungen in verschiedenen Dateiformaten beschrieben.
- CP1252
- Diese Codierung wird auch als Windows-1252 oder einfach Windows-Zeichensatz bezeichnet. Es ist eine Obermenge von ISO 8859-1 und verwendet den Codebereich 128–159, um zusätzliche Zeichen anzuzeigen, die nicht im ISO 8859-1-Zeichensatz enthalten sind.
- UTF-8
- Die Datei unterstützt alle Unicode-Zeichen und ist abwärtskompatibel mit ASCII. Weitere Informationen zu UTF finden Sie unter unicode.org/faq/utf_bom.html.
- UTF-16
- Die Datei unterstützt alle Unicode-Zeichen, ist aber nicht abwärtskompatibel mit ASCII. Weitere Informationen zu UTF finden Sie unter unicode.org/faq/utf_bom.html.
- US-ASCII
- Die Zeichencodierung basiert auf der Reihenfolge des englischen Alphabets.
- UTF-16BE
- Die Datei ist UTF-16-codiert mit Big-Endian-Reihenfolge (höchstwertiges Byte zuerst).
- UTF-16LE
- Die Datei ist UTF-16-codiert mit Little-Endian-Reihenfolge (niedrigstwertiges Byte zuerst).
- ISO-8859-1
- Dies ist eine ASCII-Zeichencodierung, die normalerweise für westeuropäische Sprachen verwendet wird. Sie ist auch bekannt als Latin-1.
- ISO-8859-3
- Dies ist eine ASCII-Zeichencodierung, die normalerweise für südeuropäische Sprachen verwendet wird. Sie ist auch bekannt als Latin-3.
- ISO-8859-9
- Dies ist eine ASCII-Zeichencodierung, die normalerweise für Türkisch verwendet wird. Sie ist auch bekannt als Latin-5.
- CP850
- Dies ist eine ASCII-Codeseite, die für westeuropäische Sprachen verwendet wird.
- CP500
- Dies ist eine EBCDIC-Codeseite, die für westeuropäische Sprachen verwendet wird.
- Shift_JIS
- Dies ist eine Zeichencodierung für Japanisch.
- MS932
- Dies ist eine Shift_JIS-Erweiterung von Microsoft, die besondere NEC-Zeichen, eine NEC-Auswahl aus IBM-Erweiterungen und IBM-Erweiterungen einschließt.
- CP1047
- Dies ist eine EBCDIC-Codeseite mit dem vollständigen Latin-1-Zeichensatz.