Cette rubrique décrit les encodages de caractères de divers formats de fichiers.
- CP1252
- Cet encodage est également connu sous le nom de jeu de caractères Windows-1252 ou simplement Windows. Il s'agit d'un super ensemble d'ISO-8859-1, qui utilise la plage de codes 128-159 pour afficher des caractères supplémentaires non inclus dans le jeu de caractères ISO-8859-1.
- UTF-8
- Prend en charge tous les caractères Unicode et est rétrocompatible avec le format ASCII. Pour plus d'informations sur UTF, reportez-vous à unicode.org/faq/utf_bom.html.
- UTF-16
- Prend en charge tous les caractères Unicode, mais n'est pas rétrocompatible avec le format ASCII. Pour plus d'informations sur UTF, reportez-vous à unicode.org/faq/utf_bom.html.
- US-ASCII
- L'encodage des caractères en fonction de l'ordre alphabétique anglais.
- UTF-16BE
- Encodage UTF-16 avec sérialisation d'octets gros-boutiste (octet le plus significatif en premier).
- UTF-16LE
- Encodage UTF-16 avec sérialisation d'octets petit-boutiste (octet le moins significatif en premier).
- ISO-8859-1
- Chiffrement de caractères ASCII utilisé habituellement pour les langues européennes occidentales. Également désigné par l'acronyme Latin-1.
- ISO-8859-3
- Chiffrement de caractères ASCII utilisé habituellement pour les langues européennes méridionales. Également connu sous le nom Latin-3.
- ISO-8859-9
- Chiffrement de caractères ASCII utilisé habituellement pour la langue turque. Également connu sous le nom Latin-5.
- CP850
- Une page de code ASCII utilisée pour écrire les langues européennes occidentales.
- CP500
- Une page de code EBCDIC utilisée pour écrire les langues européennes occidentales.
- Shift_JIS
- Un encodage de caractères pour la langue japonaise.
- MS932
- Extension Microsoft de Shift_JIS permettant d'inclure les caractères spéciaux NEC, la sélection NEC des extensions IBM et les extensions IBM.
- CP1047
- Une page de code EBCDIC avec le jeu de caractères Latin-1 complet.