2

编辑:到目前为止确定:不是2,它是两个之前的一个字符,十六进制值BF,导致下一个字符中的星号(恰好是2)

我正在使用我编写的 python 脚本运行一个 elastic-mapreduce 作业,并且我得到了一些以意外行的形式出现的奇怪输出。然而,我注意到了一种模式。预期的线条都有出乎意料的“2”,即字符的顶部曲线内带有小星星的字符。也就是说,当我在 Notepad++(但不是 Notepad 或 Word)中打开文件时,我看到一些像这样显示的文件(请原谅链接,我无法嵌入少于 10 个代表的图像):

在文本中:http: //i.imgur.com/zaWtC3S.png
放大:http: //i.imgur.com/bTYIlh6.png

当我在自己的机器上运行 python 脚本时,也会出现奇怪的 '2'(尽管没有意外的行)。有谁知道这可能是什么原因造成的?它可能会揭示我得到的奇怪的额外输出行。我也只是真的很好奇。

此外,我认为这可能与我为解析安全 URL 所做的编码/解码有关,但是当我取出这些部分时,奇怪的 '2' 仍然存在,所以不是这样。

谢谢

4

1 回答 1

2

EF BB BF在那里......那是标记的UTF-8编码BOM:字节顺序标记。请参阅http://en.wikipedia.org/wiki/Byte_order_mark。我怀疑信中的星号是你的编辑表示“我刚拿到 BOM”的方式。请参阅这个较早的问题。这似乎是一个众所周知的“事情”,并且该线程有一些处理它的建议。

于 2013-07-22T17:32:29.400 回答