您好,我必须解析通过服务器重定向解析 URI 的页面。
例子:
我有http://www.juventus.com/wps/poc?uri=wcm:oid:91da6dbb-4089-49c0-a1df-3a56671b7020重定向是http://www.juventus.com/wps/wcm/connect/ JUVECOM-IT/news/primavera%20convocati%20villar%20news%2010agosto2013?pragma=no-cache
这是我必须解析的页面的 URI。问题是重定向 URI 包含空格,这是代码。
String url = "http://www.juventus.com/wps/poc?uri=wcm:oid:91da6dbb-4089-49c0-a1df-3a56671b7020";
Document doc = Jsoup.connect(url).get();
Element img = doc.select(".juveShareImage").first();
String imgurl = img.absUrl("src");
System.out.println(imgurl);
我在第二行收到此错误:
Exception in thread "main" org.jsoup.HttpStatusException: HTTP error fetching URL. Status=404, URL=http://www.juventus.com/wps/wcm/connect/JUVECOM-IT/news/primavera convocati villar news 10agosto2013?pragma=no-cache
包含重定向的 url,因此这意味着 JSoup 获得了正确的重定向 URI。有没有办法用 %20 替换 ' ' 以便我可以毫无问题地解析?
谢谢!