java - 重音字符：编译前后的区别

Question

我制作了一个轻量级的应用程序，它读取页面的 HTML 代码并将其显示给用户。

在使用 NetBeans 进行开发期间，完全没有问题，但是当我在“Clean Build”之后使用此 IDE 提供的 .jar 时，我的口音有些问题。

例如，法语单词"renégocier", 在 NetBeans 下就是这样显示的。但是使用干净的 NetBeans 构建，会显示这个词"renÃ©gocier"......

任何的想法？

编辑：这就是我阅读 HTML 代码的方式：

URL urlObject=null;
URLConnection con=null;
String inputLine;
String codeHTML

urlObject = new URL(UrlToVerification);
con = urlObject.openConnection();
BufferedReader webData = new BufferedReader(new     InputStreamReader(con.getInputStream()));

while ((inputLine = webData.readLine()) != null)
{
    codeHTML += inputLine; // Lecture du code HTML
 }

解决方案：

代替：

BufferedReader webData = new BufferedReader(new     InputStreamReader(con.getInputStream()));

和：

BufferedReader webData = new BufferedReader(new InputStreamReader(urlObject.openStream(), "UTF-8"));

score 0 · Accepted Answer

您的代码在读取 url 内容时使用平台默认字符编码。相反，您需要将显式字符编码传递给InputStreamReader. 这应该是 url 本身指定的编码（这应该包含在"Content-Type"标头中）。如果字符编码未包含在相关标头中，则您需要选择适当的默认值。

java - 重音字符：编译前后的区别

1 回答 1

Related

Reference