我看到了有关该主题的其他问题,但都缺少重要的细节:我想转换\u00252F\u00252F\u05de\u05e8\u05db\u05d6
为 utf8。我了解您查看流中的 \u 后跟四个十六进制,然后将其转换为字节。问题如下:
- 我听说有时你在后面找 4 个字节,有时在后面找 6 个字节,这是正确的吗?如果是这样,那么您如何确定它是哪个?例如是
\u00252F
4 字节还是 6 字节? - 在这种情况下
\u0025
映射到一个字节而不是两个(0x25),为什么?四个十六进制应该代表我应该转换为utf8的utf16吗? - 我如何知道文本应该是文字字符
\u0025
还是 unicode 序列?这是否意味着必须在流中转义所有反斜杠? - 最后,当我可以使用 iconv 为我做这件事时,我手工做这件事是不是很愚蠢?