问题标签 [jsoup]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
1427 浏览

java - Jsoup 中的正则表达式适用于 java 项目,而不适用于 Android 项目

我正在尝试使用 Jsoup HTML Parser 从网站获取缩略图 URL 我需要提取所有以 60x60.jpg(或 png)结尾的 URL(所有缩略图 URL 都以此 URL 结尾)

问题是我让它在一个普通的 Java 项目中工作,但在 Android 中它不起作用。(正则表达式问题)

此代码适用于 Java 项目:

然后打印 urls 数组..它在 Java 中工作,而不是在 Android 项目中。

在 Android 中唯一有效的正则表达式只有这个

它在 Android 上运行良好.. 虽然我不需要所有以 .jpg 结尾的链接

我尝试使用

仍然不好,即使在 .(png|jpg) 之前有一个斜线

那么正则表达式的问题是什么?它在Android中的工作方式不同还是什么?它不可能是解析器问题,因为它适用于普通的 Java 项目..

0 投票
1 回答
4162 浏览

java - 使用java解析xml并保留html标签

我有一个 xml,我解析并从节点之间获取数据。但是,此数据被 html 标签包围。我创建另一个 xml 并将这些数据放入其中。现在我必须再次解析它以获得正确的 html 语法。

请帮忙。

我的班级启动了这个过程

我从 jsoup 转换后得到的示例 xml

我想提取新闻标签之间的内容。此 xml 被馈送到 XMLFunctions 类中的 XMLfromString(String xml) 函数,然后该函数仅返回“<”,剩下的正文部分。

我无法使用 html 标签获取正文以提供格式。

0 投票
1 回答
2380 浏览

html - Jsoup:安全 Elements.get(0)

以下代码片段提取了一个且仅一个元素,特别是第一个元素:

与简洁相比,这确实是一个繁琐的代码,links.get(0)但它有一个重要的特点:如果 Elements 为空,它不会抛出异常。IndexOutOfBoundException相反,它只会将字符串留空。

我可以将它封装到我自己的函数中,但我很难相信 Jsoup 还没有这样的函数(我更喜欢使用库函数而不是尽可能地“重新发明轮子”)。我搜索了文档,但找不到任何文档。

你知道Elements.get(0)Jsoup中是否存在这样的“安全”吗?

0 投票
2 回答
1767 浏览

html - 汤:

根据这个答案

HTML 4.01 规定 <a> 元素只能包含内联元素。<div> 是块元素,因此它可能不会出现在 <a> 中。

但...

HTML5 允许 <a> 元素包含块。

好吧,我只是尝试<div class="m">在一个<a>块中选择一个,使用:

并且 elmes 返回空,尽管 div 在那里。

所以我在想:要么我没有使用正确的语法在 a 中选择 div,要么...... Jsoup 不支持这个仅限 HTML5 的功能?

在 中选择 a 的正确 Jsoup 语法是div什么a

更新:我刚试过

Jsoup 对此没有任何问题(即它在 a 中返回正确数量的此类 div)。

所以我现在的问题是:为什么?

为什么a.getElementsByClass("m")有效而a.select("m")无效?

更新:根据@Delan Azabani 的建议,我刚刚尝试过:

它奏效了。所以基本上是a.select()作品,但我错过.了类名前面的。

0 投票
3 回答
480 浏览

java - 解析字符串并收集具有不同 id 的 HTML 元素

我已将 HTML 内容传递给字符串“Html_content”。我需要解析字符串“Html_content”并使用那里的ID选择几个DIV标签,例如“fullHeader”是DIV的ID,我需要选择“fullHeader”的div标签内的内容并将其存储为字符串。

我尝试了 JSOUP但我需要将收集到的 div 标签保存在 Document 中,但我需要将其保存为字符串,但使用 Jsoup 是不可能的,有没有其他选择?

0 投票
1 回答
1913 浏览

java - 从 html 解析器获取元素

我正在使用 JSOUP,并试图获取以特定 div 标签 id 开头的元素。例如:

我需要检查元素是否以字符串“test”开头并获取所有元素。

我查看了http://jsoup.org/cookbook/extracting-data/selector-syntax并尝试了多种变体:

但它仍然没有工作。任何帮助将非常感激。

0 投票
4 回答
24673 浏览

configuration - 向 Intellij IDEA 添加外部 jar 库

我遇到了一个愚蠢的问题:我正在尝试将 Jsoup 库(它只是一个外部 jar)添加到我在 Intellij Idea 中开发的 android 应用程序中,但它似乎并没有做对。我将库放在 libs 文件夹中,然后进入项目结构 -> 模块并选择依赖项,选择添加全局库,选择附加源并单击确定。

当我编写代码时,它能够自动导入类并进行编译,但是在运行时我得到“java.lang.NoClassDefFoundError: org.jsoup.Jsoup”

0 投票
1 回答
1573 浏览

java - JSoup:替换字符串会添加新行

我对 JSoup 有以下问题。

我想解析和修改以下html代码:

我正在使用以下代码来实现这一目标:

首先,它有效。所有导入 url 都替换为字符串“ FOUND”。我遇到的问题是我在最后一个导入语句和</style>之前没有的封闭标签之间有很多新行。

任何线索为什么会发生这种情况以及如何避免它?

抱歉格式错误,但我的代码的某些部分似乎刚刚在发布时被删除。第一个代码块周围有一个样式标签...

0 投票
1 回答
5706 浏览

java - 如何从 jSoup 元素创建一个数组?(爪哇)

如何获取一段 Html (values="valueIWant") 中的值,并将它们放在 Array 中?我尝试了以下方法,但没有奏效:

所以有人有答案吗?谢谢。(顺便说一句,我使用 Jsoup)

0 投票
1 回答
2169 浏览

android - Android jSoup 帮助

我正在尝试使用 jSoup从这个 url http://skyalipi.blogspot.com/2011/04/there-is-no-resistance-without.html解析 html。我正在使用此代码

在日志中,我得到以下信息

我想获取段落内容。我不知道我哪里出错了。我也参考了以下网址http://jsoup.org/cookbook/extracting-data/attributes-text-html请帮忙