0

鉴于此链接:

http://www.argenteam.net/movie/40749/American.Reunion.%282012%29

我正在尝试使用 jsoup 在该页面上获取所有这样的链接:

<a href="ed2k://|file|American.Reunion.UNRATED.DVDRip.XviD.CD1-COCAIN.avi|734205866|C92C5188830C4F740C69521F67337A45|h=Z5F72XEXRGGXBCMSOR6NS3IBCTFIHQLL|/">CD1</a>

问题是我无法获得这种链接。做了一些极端的事情,我尝试了以下代码来获取页面上的所有链接,但同样,这个“a [href]”不在列表中。

doc = Jsoup.connect("http://www.******.net/movie/40749/American.Reunion.%282012%29").get();

Elements ed2k = doc.select("a[href]");
    for (Element emule:ed2k){
            String mula = emule.attr("href");
           }

如何获取以值“ed2k”开头的所有链接?它们在 CSS“div.pmovie div.releases div.release-info div.section div.links div a”上,但我不知道问题出在哪里,它们对我的实现来说是“不可见的”。如果您查看源 HTML 代码,它似乎并不奇怪,并且所有浏览器都可以很好地管理这种链接。那么,为什么我没有使用 jsoup 和 css 选择器解析它们呢?我需要使用节点和兄弟姐妹吗?

提前致谢。

最终编辑解决方案:

该网站正在请求一个 cookie 来显示我需要的链接,因为该 cookie 仅使用真正的浏览器生成,Jsoup 无法检索所有信息,它正在连接到真实页面的简化版本。在 Jsoup 连接中发送特定的 cookie 解决了这个问题。例子:

doc = Jsoup.connect(your url here).cookie(cookie name, cookie value).get();
4

1 回答 1

4

我在您指定的网址的来源中看不到任何此类链接。

通常,您可以使用以下属性值选择语法执行您所要求的操作:

[attr^=valPrefix] 
elements with an attribute named "attr", and value starting with "valPrefix"    
Example: a[href^=http:]

(来自http://jsoup.org/apidocs/org/jsoup/select/Selector.html

于 2012-07-01T20:55:15.200 回答