Étape 3: Ce qui est UTF-8 ?
UTF-8 est un moyen de coder tous les caractères Unicode au milieu d’un fichier ASCII (texte brut) "traditionnel".
Fichiers ASCII a besoin seulement un octet par caractère. Il est parfait lorsque vous écrivez seulement en anglais.
Toutefois, vous devrez écrire un caractère chinois ou une formule mathématique dans le milieu de votre texte et UTF-8 le rend possible : lorsque le code de caractère Unicode ne rentre pas dans un seul octet, il est codé en 2, 3 ou 4 octets.
Ce codage essaie de ne pas casser le codage d’ASCII anciens et traditionnels.
Cela signifie que si vous lisez un texte UTF-8 avec un éditeur de texte qui n’est pas UTF-8 compatible, ni l’éditeur va planter, ni le formatage du texte va être tout foiré.
Au lieu d’afficher un caractère Unicode unique et correct, l’éditeur incompatible affichera des caractères ASCII étendus, 2, 3 ou 4.
En revanche, un code UTF-8 incorrect peut entraîner des problèmes inattendus si l’éditeur de texte compatible UTF-8 n’a pas été correctement codé.