Codes de 2048 à 55295 et de 57344 à 65535 sont codés dans 3 octets.
(à partir de 0 x 0800 à 0xD7FF et de 0xE000 à 0xFFFF)
Les caractères encodés dans trois octets sont comme ça :
1110xxxx, 10yyyyyy, 10zzzzzz
Codes de 65536 à 1114111 sont codées sur 4 octets.
(de 0x010000 à 0x10FFFF)
Les caractères encodés en quatre octets sont comme ça :
11110xxx, 10yyyyyy, 10zzzzzz, 10wwwwww