1

我正在尝试解析 XML 文件(RSS 提要),但我有一个问题,即 xml 文件包含 HTML 实体字符,当我将其转换为字符串时它没有出现,我不知道如何对其进行编码:

public String getXmlFromUrl(String url) {
    String xml = null;
    try {
        DefaultHttpClient httpClient = new DefaultHttpClient();
        HttpPost httpPost = new HttpPost(url);
        HttpResponse httpResponse = httpClient.execute(httpPost);
        HttpEntity httpEntity = httpResponse.getEntity();

        xml = EntityUtils.toString(httpEntity, HTTP.UTF_8);

    } catch (UnsupportedEncodingException e) {} 
    catch (ClientProtocolException e) {} 
    catch (IOException e) {}

例如:这是我想在我的 java 代码中得到的文本

<description>
     Amman Post: Shath'a Hasson pointed on the reason about &nbsp .... .... ...
</description>

但是在字符串中,我丢失了这个字符   之后的所有文本

当我尝试解析 URL 地址时:

http://www.ammanpost.net/index.php?page=article&id=25981

我在字符串中得到的是:

http://www.ammanpost.net/index.php?page=article

我失去了'&'字符之后的所有东西。

你能帮我吗 ?谢谢你。

4

1 回答 1

1

我的应用程序也有问题,我设法用Html 类修复它, 如下所示:

Html.fromHtml(string); 

对于 URL 问题,请查看URLDecoder 类

于 2012-07-24T12:29:15.443 回答