0

我在 java 中开发了一个程序,它从电子邮件帐户中获取电子邮件信息的主题、发件人、发件人和日期时间。我已经使用 html 解析器和 httpclient 完成了这项工作。我有两个问题。

  1. 当我解析电子邮件的主题字符串时,有时会得到一些奇怪的字符。例如,如果主题是“Hi Mr. müller”,我会收到主题字符串为“Hi Mr. müller”。如您所见,它没有正确赋予 ü 字符。知道这是哪种编码吗?是 UTF-8 吗?如何解码它以获得原始字符串?

  2. 我还收到了来自 pop3 的 yahoo 帐户的电子邮件信息,例如主题、发件人、收件人、日期时间等。我注意到当发件人电子邮件 id 包含 ü 或 ue(例如 reva.müller@gmx.de)时,它会将其编码为 ('=?iso-8859-1?Q?=22Reva_M=FCller=22?= ')。关于这是哪种编码的任何想法?是哑剧编码吗?如何在 java 中对其进行解码以获得正确的发件人字符串?

我真的很感激任何帮助......

4

1 回答 1

0

您需要阅读 RFC:http ://www.ietf.org/rfc/rfc2045.txt 。它将告诉您如何解释这些 = 符号。

请参阅“6.7. Quoted-Printable Content-Transfer-Encoding”。

还要寻找 Content-Type 标头以提示您了解编码。

于 2011-12-22T03:28:48.437 回答