0

我正在使用 Python 和 imaplib 从 IMAP 服务器获取电子邮件(支持各种 IMAP 服务器 - GMail 等)。

我的问题是:使用 IMAP BODY[INDEX] 命令获取特定的正文部分,HTML 带有额外的选项卡。如:

(...)</a>\t\t\t\t\t\t\t\t<a>(...)

显示 HTML 时,选项卡显然是额外的:

在此处输入图像描述

(屏幕截图是葡萄牙语,但我认为这无关紧要。

我搜索了 IMAP 文档,但没有发现任何帮助。我猜这些 \t 总是跟随标签关闭(例如 \t\t\t\t\t),所以我可以找到标签关闭后的所有标签并删除它们,但我不知道是否那将是一个可靠的方法。

谢谢

4

1 回答 1

0

我找到了一个解决方案(至少暂时)。

从 IMAP 调用响应接收数据时,有 \\r\\n 个字符分隔行。我删除这些。

但是,我发现除了这些之外,在某些情况下还有 \\t 字符与这些字符相结合。例如:

\\r\\n\\t\\t\\t\t

如果我将 \\t 与 \\r\\n 一起删除,则 HTML 将完美呈现。

于 2013-05-08T13:56:49.410 回答