我正在编写一个在 UTF-8 流中输出任意二进制文件的程序。为了避免使用无效的 UTF-8,我正在转义无效字符。我应该使用十六进制还是八进制转义?
也就是说,应该像这样转义十六进制 FFFF:
\xff\xff
或这个:
\377\377
第一个是 Python 所做的,第二个是 C 所做的。我无法决定。
[编辑] 我需要能够处理可能很长的字符串,如下所示:
SOMETHING SOMETHING\377\377\377\377\377\377\377\377SOMETHING SOMETHING
对比
SOMETHING SOMETHING\xff\xff\xff\xff\xff\xff\xff\xffSOMETHING SOMETHING