我可以使用 Lumisoft 的 IMAP 客户端从 Microsoft Exchange 读取电子邮件。我已设置交换服务器设置以将任何邮件转换为纯文本。但是,当我阅读信息时,它似乎仍然包含 HTML/CSS。
从电子邮件正文中删除 HTML/CSS 的最佳方法是什么?或者我似乎错过了交换服务器上的设置?
我可以使用 Lumisoft 的 IMAP 客户端从 Microsoft Exchange 读取电子邮件。我已设置交换服务器设置以将任何邮件转换为纯文本。但是,当我阅读信息时,它似乎仍然包含 HTML/CSS。
从电子邮件正文中删除 HTML/CSS 的最佳方法是什么?或者我似乎错过了交换服务器上的设置?
我通常采用其中一种方法...
使用正则表达式。如果您必须想出一个也适用于各种无效标记的解决方案,那么要做到正确可能有点困难,但我敢打赌,其他人在您之前已经做到了(提示:谷歌或搜索 SO)。
使用 HTML 解析器库。您可以在那里找到任何流行的编程语言。我推荐使用 Html Agility Pack。
我不确定您的设置是如何工作的,是否可以运行脚本等。显然,HTML 解析器将是解析 HTML 的最佳方式。例如,使用 Hpricot(一个 Ruby HTML 解析库),您可以puts doc.find_element('body').inner_text
打印文档的文本内容。