问题标签 [jsoup]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
1256 浏览

java - 使用 Jsoup 解析 HTML 字符串时出错

我正在制作一个 Android 应用程序,我正在使用 JRE 6 和最新的 jSoup 库。我正在尝试使用以下方法解析包含 HTML 的字符串:

我得到以下异常:

java.lang.NoSuchMethodError java.lang.string.isEmpty

我该如何纠正这个问题?

0 投票
6 回答
27888 浏览

java - 读取 JSON 内容

我正在使用 jsoup 来抓取一些 HTML 数据,效果很好。现在我需要提取一些 JSON 内容(只有 JSON,不是 HTML)。我可以使用 jsoup 轻松做到这一点,还是必须使用另一种方法来做到这一点?jsoup 执行的解析是对 JSON 数据进行编码,因此无法使用 Gson 正确解析。

0 投票
1 回答
1987 浏览

java - Jsoup 获取部分页面

我正在尝试抓取投标网站的内容,但无法获取网站的完整页面。我在 xulrunner 上使用 crowbar 首先获取页面(因为 ajax 以惰性方式加载某些元素),然后从文件中抓取。但是在 birivals 网站的主页上,即使本地文件格式正确,这也会失败。jSoup 似乎只是在 html 代码中间以“...”字符结尾。如果有人以前遇到过这种情况,请帮助。[此链接]调用以下代码。

0 投票
2 回答
218 浏览

java - 如何从 Java 中的网页获取信息?

有谁知道我可以从 Java 网页获取信息的快速方法?例如,如果我正在查看这样的页面:http ://www.ncbi.nlm.nih.gov/pubmed/?term= 10952317 并且我想提取标题“MeSH 术语”下方的单词列表,我该怎么做呢?

我有一些可以阅读源代码的东西,但它充满了 HTML 标记等......

任何帮助深表感谢!

0 投票
3 回答
5171 浏览

jsoup - Jsoup 解析带有 tbody 标签的 Html 文件

我最近在 tbody 标记方面出现了不一致的 Jsoup 行为,当我使用 Html 结构解析 Web 上的远程页面时,例如:

Jsoup 在 select method() 返回的元素中不包含 tbody 元素。

我使用方法 connect().get() 将远程页面加载到 Document 变量中,例如:

但是当我解析本地磁盘上的同一页面时(在我下载之后)。Jsoup 包含 tbody 标签。我的表达式将不再起作用,因为它缺少 tbody 元素。

我用:

我的 Jsoup 表达式仅适用于第一种情况。

有没有办法强制 Jsoup 识别 tbody 元素(或删除它),以便在两种情况下都可以使用相同的表达式?

这是 Jsoup 的正常行为吗?

我是否也应该在解析本地页面时使用 connect 方法?

0 投票
6 回答
62535 浏览

java - jsoup 发布和 cookie

我正在尝试使用 jsoup 登录一个站点然后抓取信息,我遇到了一个问题,我可以成功登录并从 index.php 创建一个文档,但我无法获取站点上的其他页面。我知道我需要在发布后设置一个 cookie,然后在我试图打开网站上的另一个页面时加载它。但是我该怎么做呢?以下代码让我登录并获取 index.php

我知道我可以使用 apache httpclient 来做到这一点,但我不想这样做。

0 投票
3 回答
77 浏览

java - 如何处理我的应用程序中的网页内容

我的系统(我正在使用 JSP)处理网络上的现有网站。我的应用程序应该能够显示该网站的页面并进行一些更改,例如突出显示某些单词。

因此,我的程序将做的是从该网站获取页面并突出显示一些特定的单词,然后再次向我的系统用户显示带有突出显示的单词的页面。

我怎么能用java做到这一点?

0 投票
2 回答
1153 浏览

android - Android中get()的Jsoup错误

我试图在我的 Android 应用程序中使用 Jsoup 1.6.0,但由于某种原因它崩溃了。我将代码简化为:

但是,每当我在手机(USB 调试模式)或模拟器上运行上述程序时,我都会收到我的程序意外崩溃的消息——甚至没有发现错误。如果我将 try 块的内容替换为

该程序运行良好,所以似乎 get() 方法导致了问题......

仅供参考,在我的 AndroidManifest.xml 中我确实包含了

在正确的位置,并且 R.layout.main 是 ADT 在您创建新项目时生成的默认布局。我正在为这个项目使用 Android API 7 级。我怎样才能让它工作?

0 投票
3 回答
582 浏览

java - 当Jsoup解析只包含“0”的Html标签时,会返回null吗?

我用的是jsoup-1.6.0,解析html标签字符串,只包含字符串内容“0”,但是jsoup返回null,我明白...

例如:

这是为什么?


回答:

应该是bug,binary_runner说jsoup-1.3.3运行良好,我测试jsoup-1.5.2也运行良好。所以,我决定使用 jsoup-1.5.2 。

感谢 binary_runner!

0 投票
1 回答
5620 浏览

android - 在 Android 中处理 Web 上的数据

我是一名新的 Android 程序员,我的问题是:

我想从 HTML 文件中获取一些信息。下载它并以舒适的方式解析它的最佳方式是什么?

谢谢!