我需要从字符串中删除字节顺序标记。我已经有了查找 BOM 的代码,但现在我需要将其从实际字符串中删除。
给你举个例子。BOMfeff
的长度为 2 个字节,这意味着字符串的前两个字节不应出现在最终字符串中。但是,当我使用 Python 字符串剥离时,会从字符串中剥离太多内容。
代码片段:
print len(bom)
print as_hex(bom)
print string
print as_hex(string)
string = string[len(bom):]
print string
print as_hex(string)
输出:
2
feff
Organ
feff4f7267616e
rgan
7267616e
我希望得到的是:
2
feff
Organ
feff4f7267616e
Organ
4f7267616e
该as_hex()
函数只是将字符打印为十六进制 ( "".join('%02x' % ord(c) for c in bytes
))。