我正在编写一些代码来加载和解析来自网络的 HTML 文档。
我像这样使用JDOM:
SAXBuilder parser = new SAXBuilder();
Document document = (Document)parser.build("http://www.google.com");
Element rootNode = document.getRootElement();
/* and so on ...*/
它像那样工作得很好。但是,当我将 URL 更改为其他一些网站时,例如“http://www.kijiji.com”,parser.build(...)
线路挂起。
知道它为什么挂起吗?我想知道这是否可能是因为 kijiji 知道我不是一个“真正的”网络浏览器——也许我必须欺骗我的 http 请求,所以它看起来像是来自 IE 或类似的东西?
任何想法都是有用的,谢谢!
抢