问题标签 [jsoup]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
4168 浏览

java - JSoup - 选择所有评论

我想使用 JSoup 从文档中选择所有评论。我想做这样的事情:

我试过这个:

}

但是eclipse中出现以下错误“不兼容的条件操作数类型元素和注释”。

干杯,

皮特

0 投票
1 回答
1614 浏览

java - Jsoup - 选择标签的问题

有没有办法在另一个元素之后选择一个元素?

例如,如果我有:

我想选择我能做的第一个:

但是我该怎么说:选择第一个之后的 td 呢?

谢谢您的帮助。

0 投票
2 回答
17428 浏览

java - 如何使用 Jsoup 从相对 HTML 链接中提取绝对 URL?

我正在使用Jsoup提取网页的 URL。这些 URL的href属性是相对的,例如:

这是我的尝试:

这工作正常,但如果我使用

要获取绝对 URL http://example.com/text,它不起作用。如何获取绝对 URL?

0 投票
2 回答
1164 浏览

java - 使用 Jsoup.Jar 进行 HTML 解析

我将 Jsoup.jar 用于上述程序。

我正在访问该网页,我的目标是打印在标签中找到的文本<span class="BVRRReviewText description">text</span>

但是没有任何东西被打印为输出。程序中没有添加任何内容String html。但是attValue正在获取 span 标签的所有属性值。

我一定是哪里出错了?请指教。

0 投票
2 回答
2129 浏览

java - 有没有办法深度克隆 JSoup Document 对象并返回完全相同的 HTML?

有没有办法深度克隆JSoup Document对象并返回完全相同的HTML

我有一个预解析的对象,我只想克隆它,因为我怀疑克隆会比总是再次解析HTML更快。

我试图通过迭代 Document 对象的所有元素来克隆它,但是我没有 doctype 声明等。

PS我当然不希望得到评论......

0 投票
3 回答
1070 浏览

android - 互联网访问在 Android 1.6 中不工作,但在 2.0/2.1/2.2 中工作

我正在尝试在我的 android 活动中使用 jsoup (1.3.3) 解析一些 html。当我调用此代码时

它在 android 2.1 和 2.2 中运行良好,但在 1.6 中我得到一个“java.io.IOException: 403 Error loading URL”。

我正在使用模拟器对此进行测试,我注意到 admob 广告也没有在 1.6 中显示,但它们在 2.0、2.1 和 2.2 中有效。

在 1.6 模拟器中使用 Web 浏览器确实有效,所以我很确定问题出在我的代码中。

我在 1.6 中是否需要一些额外的权限才能访问互联网,而在 2.0+ 中不需要?

这就是我的清单文件的结构,uses-permission 标签的位置有什么影响吗?

我已经尝试从头开始创建一个新项目,只使用一个使用 Jsoup.connect() 方法的 hello world 屏幕,并且在同一个 1.6 模拟器上运行良好,所以它一定是代码问题,但我无法弄清楚.

0 投票
4 回答
18975 浏览

java - 获取 java.lang.ClassNotFoundException: org.jsoup.Jsoup

我在谷歌应用引擎上运行我的应用程序。我所拥有的只是一个尝试使用 Jsoup 的简单 servlet。但是,当我运行应用程序时,我得到 java.lang.ClassNotFoundException: org.jsoup.Jsoup。

我正在使用 Eclipse,所以我在 Java Build Path -> Libraries 中添加了 jsoup jar 文件

0 投票
1 回答
2828 浏览

java - 在 Android 中遇到 JSoup 问题(用于解析 HTML)

我正在开发一个小测试应用程序,以从网络上抓取一些数据(在本例中为 XKCD 漫画)并将其显示在我的手机上。这是我第一次涉足 Android 编程,我对 Java 不太熟悉,所以我并没有太大的野心。我成功地用 Java 编写了一个程序,该程序执行了我想在 Android 上执行的相同功能,并且它运行得非常好,但是我在 Java 中工作的一些代码会导致在 Android 中关闭。特别是这个小代码块:

每次运行时,我都会在日志中看到“失败”消息。如果我删除我的代码的那部分,我的应用程序运行良好,所以我知道错误一定存在。如果您想知道,“home”在我的代码中的其他地方被定义为文档。在 Java 中这运行良好,我也很奇怪在 Eclipse 中为 Android 开发时,它迫使我用 try-catch 块包围该语句,但在 Java 中我不需要 try-catch。任何想法为什么这不起作用?如果您需要更多信息或更多我的代码,我会提供(尽管我试图给出完整的故事)。

非常感谢您的帮助

0 投票
2 回答
1159 浏览

java - 如何通过防火墙解析网页

我正在尝试使用此Jsoup代码解析 Web url:

我总是收到以下错误

我的电脑是由 kerio winroute 防火墙控制的网络成员。在互联网连接之前,我们从我们的网络浏览器连接到防火墙。原因应该是这个。我如何解析网址?

0 投票
1 回答
3058 浏览

java - jSoup isn't unescaping my HTML entities properly

I have a little sample program which extracts some information from an HTML document.

If you've worked with jSOup you'll know that the output of this should be exa mple but the output is exaámple. Why is jSoup not unescapting my HTML entities properly or am i simply doing this wrong?

All my HTML entities get unescaped incorrectly and not only &nbsp;