0

我尝试了以下解决方案:

  1. 如何使用Jsoup从html中提取段落文本?
  2. jsoup如何提取此文本

但是这两个示例都使用标签中的文本。

我的 html 网络搜索中有这段独特的代码:

在此处输入图像描述

我需要的是获取 d.href 变量附带链接

我试过这样的代码:

  Elements link = jSoupConnection.select(":contains(d.href)");  
  Elements link = jSoupConnection.select("#d.href");
  Elements link = jSoupConnection.getElementsByAttributeValueContaining("d.href","google");

但直到现在他们都没有工作。

我还尝试在http://jsoup.org/cookbook/上进行一项研究,但也没有成功。有没有对 Jsoup 更有经验的人可以帮帮我吗?提前致谢

4

1 回答 1

0

如果您的文本没有任何您可以使用 Jsoup 选择元素特定捕获的标签,您应该下载漏洞页面(您可以使用Elements link = jSoupConnection.select("*");),然后在您的应用程序中将其作为一个文本文件打开以检索您的任何内容想。如果下载的文件太大,这是我的问题,请尝试限制文件大小下载;您可以在这些链接上找到更多详细信息:

  1. 使用 java 限制文件大小创建
  2. Java中如何限制文件大小
于 2013-07-20T19:31:03.627 回答