История ASCII
American Standard Code for Information Interchange (1963). 7 бит = 128 символов. Символы 0-31 — управляющие (LF, CR, BEL, ESC). Символ 32 — пробел. 33-126 — печатные. 127 — DEL.
ASCII и UTF-8
UTF-8 обратно совместим с ASCII: коды 0-127 занимают один байт с тем же значением. Коды выше 127 (кириллица, CJK) кодируются 2-4 байтами. Русская «А» = U+0410 = 0xD0 0x90 в UTF-8.
Управляющие символы
LF (10) и CR (13) — конец строки. Unix: LF. Windows: CR+LF. Старые Mac: CR. BEL (7) — звуковой сигнал терминала. ESC (27) — начало ANSI escape-последовательностей для цвета в терминале (ниже пример в нотации caret).
^[[31mкрасный текст^[[0m
; в байтах: 1B 5B 33 31 6D … 1B 5B 30 6D (ESC [ 3 1 m … ESC [ 0 m)