1

我正在尝试创建解析所有支持提要的网站的 RSS 提要应用程序。我为此目的使用了 Jsoup。并以这种方式解析不同类型的 rss

org.jsoup.select.Elements links = doc.select("link[type=application/rss+xml]");  
org.jsoup.select.Elements links = doc.select("link[type=application/atom+xml]");

它解析各种网站,如 engadget.com、ndtv.com 等,但是当我尝试粘贴 stackoverflow.com 或 1up.com 等网站时,出现以下错误。

线程以未捕获的异常退出 (group=0x40efe378)

Caused by: java.lang.IllegalStateException: Target host must not be null, or set in parameters. scheme=null, host=null, path=/rss

搜索错误 #1 甚至没有产生 1 个结果。搜索错误#2 有很多。所有人都声明在任何网站网址之前使用 http://

http://1up.com

但是错误仍然存​​在。我之前已经实现了这个,因为所有其他网站的 RSS 都被解析了。这是我用于 1up.com RSS 提要的 logcat。

D/URL Length(4097): 14
D/url name(4097): http://1up.com
D/No of RSS links found(4097):  1
W/dalvikvm(4097): threadid=12: thread exiting with uncaught exception (group=0x40efe378)
E/AndroidRuntime(4097): FATAL EXCEPTION: AsyncTask #1
E/AndroidRuntime(4097): java.lang.RuntimeException: An error occured while executing doInBackground()
E/AndroidRuntime(4097):     at android.os.AsyncTask$3.done(AsyncTask.java:299)
E/AndroidRuntime(4097):     at java.util.concurrent.FutureTask$Sync.innerSetException(FutureTask.java:273)
E/AndroidRuntime(4097):     at java.util.concurrent.FutureTask.setException(FutureTask.java:124)
E/AndroidRuntime(4097):     at java.util.concurrent.FutureTask$Sync.innerRun(FutureTask.java:307)
E/AndroidRuntime(4097):     at java.util.concurrent.FutureTask.run(FutureTask.java:137)
E/AndroidRuntime(4097):     at android.os.AsyncTask$SerialExecutor$1.run(AsyncTask.java:230)
E/AndroidRuntime(4097):     at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1076)
E/AndroidRuntime(4097):     at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:569)
E/AndroidRuntime(4097):     at java.lang.Thread.run(Thread.java:856)
E/AndroidRuntime(4097): Caused by: java.lang.IllegalStateException: Target host must not be null, or set in parameters. scheme=null, host=null, path=/rss
E/AndroidRuntime(4097):     at org.apache.http.impl.client.DefaultRequestDirector.determineRoute(DefaultRequestDirector.java:591)
E/AndroidRuntime(4097):     at org.apache.http.impl.client.DefaultRequestDirector.execute(DefaultRequestDirector.java:293)
E/AndroidRuntime(4097):     at org.apache.http.impl.client.AbstractHttpClient.execute(AbstractHttpClient.java:555)
E/AndroidRuntime(4097):     at org.apache.http.impl.client.AbstractHttpClient.execute(AbstractHttpClient.java:487)
E/AndroidRuntime(4097):     at org.apache.http.impl.client.AbstractHttpClient.execute(AbstractHttpClient.java:465)
E/AndroidRuntime(4097):     at com.maulik.rss.RssParser.getXmlFromUrl(RssParser.java:214)
E/AndroidRuntime(4097):     at com.maulik.rss.RssParser.getRSSFeed(RssParser.java:69)
E/AndroidRuntime(4097):     at com.maulik.rss.RSS_AddNewSiteActivity$loadRSSFeed.doInBackground(RSS_AddNewSiteActivity.java:97)
E/AndroidRuntime(4097):     at com.maulik.rss.RSS_AddNewSiteActivity$loadRSSFeed.doInBackground(RSS_AddNewSiteActivity.java:1)
E/AndroidRuntime(4097):     at android.os.AsyncTask$2.call(AsyncTask.java:287)
E/AndroidRuntime(4097):     at java.util.concurrent.FutureTask$Sync.innerRun(FutureTask.java:305)
E/AndroidRuntime(4097):     ... 5 more
4

1 回答 1

1

IllegalStateException: Target host must not be null, or set in parameters.表示问题是由无效(或空)的 RSS地址引起的。

http://1up.com<link rel="alternate" type="application/rss+xml" title="RSS" href="/rss?x=1" />从您的 logcat 输出看来,请求转到了错误的地址: http://rss?x=1 (或相同的 w/o http)所以而不是相对链接 1up.com/rss ,它将链接作为绝对链接处理。
您可以在解析提要之前检测相对链接并将其转换为绝对链接。

虽然有些站点使用RSS标准,但有些站点使用Atom标准。RSS 和 Atom 提要的标签不同
您可能需要为每种提要类型创建不同的解析算法。

于 2013-09-17T18:19:17.833 回答