0

我想使用 JSOUP 从这个片段中提取“电影”文本: 在此处输入图像描述

如您所见,除了第一个跨度之外,第二个跨度标记也没有 ID 或类。我的问题是如何检索该文本?

谢谢你。

<span>                                                             
</span><span><span class="contentTitle">
Program Type:</span>
<span style="font-size: 14px;">
Movie</span>
<br />
</span><span id="MainContent_trProgramCategories"><span class="contentTitle">
 Categories:</span>&nbsp; 
<span style="font-size: 14px;">Horror, Thriller
</span>
4

3 回答 3

3

试试这个

Element element = doc.select("#MainContent_trProgramCategories  .contentTitle").get(0).nextElementSibling();
于 2013-08-13T09:29:26.067 回答
2

select(...)您需要通过使用该方法来不断减少数据。例如,只需执行以下操作:

Elements myEles = doc.select("div[id=MainContent_UpdatePanel2] td");
String text = myEles.text();

System.out.println(text);

将为您提供您可能感兴趣的大部分内容。

于 2013-08-13T02:29:25.703 回答
1

您可以使用“充满鳗鱼的气垫船”的建议。

不过,对于未来的用例,获取元素的 CSS 路径或 XPath 的最简单方法是使用 Firebug 扩展。

萤火虫扩展

您可以单击“错误外观图像”旁边的“鼠标指针外观图标”,然后选择要从浏览器中检索值的元素,然后下一行的 XPath/CSS 文本框将为您提供您可以使用的路径采用。

只需复制该文本并将其粘贴到代码中

doc.select("HERE PASTE THE XPATH/CSS PATH THAT YOU COPIED FROM FIREBUG").text();

如果您使用的是铬,

你可以

  1. 右键单击要从中检索文本值的元素
  2. 选择“检查元素”
  3. 再次右键单击调试器中突出显示的元素
  4. 选择“复制 XPath”
于 2013-08-13T09:48:52.647 回答