0

我制作了一个轻量级的应用程序,它读取页面的 HTML 代码并将其显示给用户。

在使用 NetBeans 进行开发期间,完全没有问题,但是当我在“Clean Build”之后使用此 IDE 提供的 .jar 时,我的口音有些问题。

例如,法语单词"renégocier", 在 NetBeans 下就是这样显示的。但是使用干净的 NetBeans 构建,会显示这个词"renégocier"......

任何的想法?

编辑:这就是我阅读 HTML 代码的方式:

URL urlObject=null;
URLConnection con=null;
String inputLine;
String codeHTML

urlObject = new URL(UrlToVerification);
con = urlObject.openConnection();
BufferedReader webData = new BufferedReader(new     InputStreamReader(con.getInputStream()));

while ((inputLine = webData.readLine()) != null)
{
    codeHTML += inputLine; // Lecture du code HTML
 }

解决方案 :

代替:

BufferedReader webData = new BufferedReader(new     InputStreamReader(con.getInputStream()));

和 :

BufferedReader webData = new BufferedReader(new InputStreamReader(urlObject.openStream(), "UTF-8"));
4

1 回答 1

0

您的代码在读取 url 内容时使用平台默认字符编码。相反,您需要将显式字符编码传递给InputStreamReader. 这应该是 url 本身指定的编码(这应该包含在"Content-Type"标头中)。如果字符编码未包含在相关标头中,则您需要选择适当的默认值。

于 2013-07-30T15:55:48.783 回答