java - IOException - XML 解析

Question

我正在尝试从以下 url 解析 xml 响应-

http://imdbapi.org/?type=xml&q=argo

为此，我编写了以下代码 -

    try
    {
        XMLReader myReader = XMLReaderFactory.createXMLReader();
        xmlHandler handlerobj = new xmlHandler();
        myReader.setContentHandler(handlerobj);
        myReader.parse(new InputSource(new URL("http://imdbapi.org/?type=xml&q=argo").openStream()));
    }
    catch(Exception e)
    {
        System.out.println("Error");
    }

xmlHandler 是一个扩展 DefaultHandler 的类。我在上面的代码中得到一个IOException 。

堆栈跟踪 -

java.io.IOException: Server returned HTTP response code: 403 for URL:   http://imdbapi.org/?type=xml&q=argo
at sun.net.www.protocol.http.HttpURLConnection.getInputStream(Unknown Source)
at java.net.URL.openStream(Unknown Source)
at gui.getimdbdata(gui.java:73)
at gui.main(gui.java:64)

这段代码有什么问题？

score 2 · Accepted Answer

您必须设置 user.agent：

System.setProperty("http.agent", "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36     (KHTML, like Gecko) Chrome/28.0.1500.29 Safari/537.36");

（如果您使用浏览器连接到 URL，这是自动完成的）

score 0 · Accepted Answer

解决了这个问题，感谢@dijkstra！

Web 服务只允许浏览器获取 xml 数据。

以下是修改 -

       url = new URL(urlString);
       uc = url.openConnection();
       uc.addRequestProperty("User-Agent", 
                "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.0)");

       uc.connect();
       uc.getInputStream();
       BufferedInputStream in = new BufferedInputStream(uc.getInputStream());

java - IOException - XML 解析

2 回答 2

Related

Reference