鉴于此链接:
http://www.argenteam.net/movie/40749/American.Reunion.%282012%29
我正在尝试使用 jsoup 在该页面上获取所有这样的链接:
<a href="ed2k://|file|American.Reunion.UNRATED.DVDRip.XviD.CD1-COCAIN.avi|734205866|C92C5188830C4F740C69521F67337A45|h=Z5F72XEXRGGXBCMSOR6NS3IBCTFIHQLL|/">CD1</a>
问题是我无法获得这种链接。做了一些极端的事情,我尝试了以下代码来获取页面上的所有链接,但同样,这个“a [href]”不在列表中。
doc = Jsoup.connect("http://www.******.net/movie/40749/American.Reunion.%282012%29").get();
Elements ed2k = doc.select("a[href]");
for (Element emule:ed2k){
String mula = emule.attr("href");
}
如何获取以值“ed2k”开头的所有链接?它们在 CSS“div.pmovie div.releases div.release-info div.section div.links div a”上,但我不知道问题出在哪里,它们对我的实现来说是“不可见的”。如果您查看源 HTML 代码,它似乎并不奇怪,并且所有浏览器都可以很好地管理这种链接。那么,为什么我没有使用 jsoup 和 css 选择器解析它们呢?我需要使用节点和兄弟姐妹吗?
提前致谢。
最终编辑解决方案:
该网站正在请求一个 cookie 来显示我需要的链接,因为该 cookie 仅使用真正的浏览器生成,Jsoup 无法检索所有信息,它正在连接到真实页面的简化版本。在 Jsoup 连接中发送特定的 cookie 解决了这个问题。例子:
doc = Jsoup.connect(your url here).cookie(cookie name, cookie value).get();