您提到的 4 种编码(Shift-JIS、UTF-8、EUC-JP、ISO-2022-JP)都没有在日文字符中使用 CR 或 LF 字符。对于 UTF-8 和 EUC-JP,低 ascii 字符和日语字符中的字节之间没有任何重叠。但是,对于 Shift-JIS 和 ISO-2022-JP,存在重叠,但不在您找到 CR 和 LF 的范围内。
For ISO-2022-JP,
First-byte range: 0x21 - 0x7E
Second-byte range: 0x21 - 0x7E
而在各种字符集之间来回切换的转义序列字符有:
0x1B, 0x28, 0x24, 0x40, 0x42, and 0x4A
如您所见,ISO-2022-JP 中用于对日文字符进行编码的字符都没有与 CR 或 LF 重叠。
For Shift-JIS,
First-byte range: 0x81 - 0x9F, 0xE0 - 0xEF
Second-byte range: 0x40 - 0x7E, 0x80 - 0xFC
Half-width katakana: 0xA1 - 0xDF
同样,CR 和 LF 没有重叠。