1

当我从 Java 网页中检索数据时,为什么 html 实体显示错误:

    URL url = new URL("http://www.eslcafe.com/joblist/index.cgi?read=27334");
    URLConnection connection = url.openConnection();

    BufferedReader reader = new BufferedReader(new InputStreamReader(connection.getInputStream(), Charset.forName("ISO-8859-1")));

    String line = null;

    while ((line = reader.readLine()) != null) {

        System.out.println(line);
    }

这个页面的标题应该被检索为“A LITTLE Different in Hsin-Chu, Taiwan!”,但是“”从来没有正确显示,我的默认字符集也是“ISO-8859-1”

4

1 回答 1

0

我已经用 curl 下载了你的网页,并用十六进制编辑器打开了它。可以看出《新竹有一点不同》前面的“”实际上是0xA0而不是0x20,即不是人们常用的空白字符,也许这就是它显示不正确的原因。希望能帮助到你。

于 2012-12-30T08:41:58.003 回答