2

我需要解码从 Outlook 保存为纯文本的电子邮件。不幸的是,它们不是普通的 ISO-8859-1,因为它们包含特殊的“智能引用”字符。Outlook 使用的代码页是否具有真实名称(我可以在 Python 中将其传递给 unicode.decode() )还是只是一些我必须手动解码的任意虚构的废话?如果是这样,是否有人对微软添加的所有“特殊”字符有参考?

4

2 回答 2

2

Outlook 很可能会将邮件保存在您当前的语言环境中。我的猜测是 Windows-1252。

Nitpick:你所说的“智能引用”实际上是引用应该看起来的样子。您在帖子中使用的引号称为“打字机引号”;对于机械打字机来说,键的数量是一个主要的成本因素和报价,它们看起来非常相似,英寸符号被合并成一个键,美学被诅咒了。

于 2011-01-27T12:34:41.237 回答
1

有许多(取决于语言环境的)Windows 代码页,所以最坏的情况可能取决于发件人所在的国家/地区。

于 2011-01-27T12:34:56.260 回答