0

下面是我解析链接标签的网址

http://www.mobileapp.pcmac.org/mobile/xml/sisapp.asp?sid=353&pn=news2

在这个网址中,数据是

 <item>
      <title>DATA WAREHOUSE (Quick link and training information)</title>
      <category> News</category>
      <description></description>
      <pubDate>Tue, 1 Dec 2009 00:00 CST</pubDate>
      <enclosure url="" length="0" type="image/jpg" />
      **<link>http://www.mcpss.com?PN=&apos;News2&apos;&amp;SubP=&apos;DNewsStory&apos;&amp;gn=&amp;NewsID=17662&amp;ShowNav=&amp;StoryGroup=Current</link>**
    </item>

我正在从上面的数据中解析链接标签。但是当我尝试将该值放在下面的代码中时,它会抛出以下异常: HTTP error fetching URL

try {
           String website=list.get(0);
           Document doc = Jsoup.connect(website).get();
           Elements el=doc.getElementsByClass("header");
           Elements atr= doc.select("p span");
           String ss="";
           for(Element s:atr)
               ss+=s.text();
                String text=el.text();
                t1.setText(text);
                t2.setText(ss);
     } catch (Exception e) {
log.d("Error",e.getMessage());

              }

如果我对该链接值进行硬编码,它工作正常。我需要一些帮助来解决这个问题。

4

1 回答 1

0

首先,您需要检查您的解析是否正确。所以使用 println 或类似的。如果 url 已被确认,您可以执行下一步。

大多数问题都发生在重定向上。

在您的示例中,解析的链接将是:

http://www.mcpss.com?PN=&apos;News2&apos;&amp;SubP=&apos;DNewsStory&apos;&amp;gn=&amp;NewsID=17662&amp;ShowNav=&amp;StoryGroup=Current

被重定向到的实际站点是:

http://www.mcpss.com/?PN=&apos;News2&apos;&amp;SubP=&apos;DNewsStory&apos;&amp;gn=&amp;NewsID=17662&amp;ShowNav=&amp;StoryGroup=Current

可以看到添加了一个斜线。尝试使用 jsoup 连接到该最终 url。如果这有效,那么您需要先解析所有链接并在使用 jsoup 连接之前添加斜杠。如果适用,它应该是所有 url 的持久方案。

希望能帮助到你

于 2013-01-23T07:54:10.260 回答