我在 java 中开发了一个程序,它从电子邮件帐户中获取电子邮件信息的主题、发件人、发件人和日期时间。我已经使用 html 解析器和 httpclient 完成了这项工作。我有两个问题。
当我解析电子邮件的主题字符串时,有时会得到一些奇怪的字符。例如,如果主题是“Hi Mr. müller”,我会收到主题字符串为“Hi Mr. müller”。如您所见,它没有正确赋予 ü 字符。知道这是哪种编码吗?是 UTF-8 吗?如何解码它以获得原始字符串?
我还收到了来自 pop3 的 yahoo 帐户的电子邮件信息,例如主题、发件人、收件人、日期时间等。我注意到当发件人电子邮件 id 包含 ü 或 ue(例如 reva.müller@gmx.de)时,它会将其编码为 ('=?iso-8859-1?Q?=22Reva_M=FCller=22?= ')。关于这是哪种编码的任何想法?是哑剧编码吗?如何在 java 中对其进行解码以获得正确的发件人字符串?
我真的很感激任何帮助......