问题标签 [jsoup]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
java - Jsoup 中的正则表达式适用于 java 项目,而不适用于 Android 项目
我正在尝试使用 Jsoup HTML Parser 从网站获取缩略图 URL 我需要提取所有以 60x60.jpg(或 png)结尾的 URL(所有缩略图 URL 都以此 URL 结尾)
问题是我让它在一个普通的 Java 项目中工作,但在 Android 中它不起作用。(正则表达式问题)
此代码适用于 Java 项目:
然后打印 urls 数组..它在 Java 中工作,而不是在 Android 项目中。
在 Android 中唯一有效的正则表达式只有这个
它在 Android 上运行良好.. 虽然我不需要所有以 .jpg 结尾的链接
我尝试使用
仍然不好,即使在 .(png|jpg) 之前有一个斜线
那么正则表达式的问题是什么?它在Android中的工作方式不同还是什么?它不可能是解析器问题,因为它适用于普通的 Java 项目..
java - 使用java解析xml并保留html标签
我有一个 xml,我解析并从节点之间获取数据。但是,此数据被 html 标签包围。我创建另一个 xml 并将这些数据放入其中。现在我必须再次解析它以获得正确的 html 语法。
请帮忙。
我的班级启动了这个过程
我从 jsoup 转换后得到的示例 xml
我想提取新闻标签之间的内容。此 xml 被馈送到 XMLFunctions 类中的 XMLfromString(String xml) 函数,然后该函数仅返回“<”,剩下的正文部分。
我无法使用 html 标签获取正文以提供格式。
html - Jsoup:安全 Elements.get(0)
以下代码片段提取了一个且仅一个元素,特别是第一个元素:
与简洁相比,这确实是一个繁琐的代码,links.get(0)
但它有一个重要的特点:如果 Elements 为空,它不会抛出异常。IndexOutOfBoundException
相反,它只会将字符串留空。
我可以将它封装到我自己的函数中,但我很难相信 Jsoup 还没有这样的函数(我更喜欢使用库函数而不是尽可能地“重新发明轮子”)。我搜索了文档,但找不到任何文档。
你知道Elements.get(0)
Jsoup中是否存在这样的“安全”吗?
html - 汤:
HTML 4.01 规定 <a> 元素只能包含内联元素。<div> 是块元素,因此它可能不会出现在 <a> 中。
但...
HTML5 允许 <a> 元素包含块。
好吧,我只是尝试<div class="m">
在一个<a>
块中选择一个,使用:
并且 elmes 返回空,尽管 div 在那里。
所以我在想:要么我没有使用正确的语法在 a 中选择 div,要么...... Jsoup 不支持这个仅限 HTML5 的功能?
在 中选择 a 的正确 Jsoup 语法是div
什么a
?
更新:我刚试过
Jsoup 对此没有任何问题(即它在 a 中返回正确数量的此类 div)。
所以我现在的问题是:为什么?
为什么a.getElementsByClass("m")
有效而a.select("m")
无效?
更新:根据@Delan Azabani 的建议,我刚刚尝试过:
它奏效了。所以基本上是a.select()
作品,但我错过.
了类名前面的。
java - 解析字符串并收集具有不同 id 的 HTML 元素
我已将 HTML 内容传递给字符串“Html_content”。我需要解析字符串“Html_content”并使用那里的ID选择几个DIV标签,例如“fullHeader”是DIV的ID,我需要选择“fullHeader”的div标签内的内容并将其存储为字符串。
我尝试了 JSOUP但我需要将收集到的 div 标签保存在 Document 中,但我需要将其保存为字符串,但使用 Jsoup 是不可能的,有没有其他选择?
java - 从 html 解析器获取元素
我正在使用 JSOUP,并试图获取以特定 div 标签 id 开头的元素。例如:
我需要检查元素是否以字符串“test”开头并获取所有元素。
我查看了http://jsoup.org/cookbook/extracting-data/selector-syntax并尝试了多种变体:
但它仍然没有工作。任何帮助将非常感激。
configuration - 向 Intellij IDEA 添加外部 jar 库
我遇到了一个愚蠢的问题:我正在尝试将 Jsoup 库(它只是一个外部 jar)添加到我在 Intellij Idea 中开发的 android 应用程序中,但它似乎并没有做对。我将库放在 libs 文件夹中,然后进入项目结构 -> 模块并选择依赖项,选择添加全局库,选择附加源并单击确定。
当我编写代码时,它能够自动导入类并进行编译,但是在运行时我得到“java.lang.NoClassDefFoundError: org.jsoup.Jsoup”
java - JSoup:替换字符串会添加新行
我对 JSoup 有以下问题。
我想解析和修改以下html代码:
我正在使用以下代码来实现这一目标:
首先,它有效。所有导入 url 都替换为字符串“ FOUND
”。我遇到的问题是我在最后一个导入语句和</style>
之前没有的封闭标签之间有很多新行。
任何线索为什么会发生这种情况以及如何避免它?
抱歉格式错误,但我的代码的某些部分似乎刚刚在发布时被删除。第一个代码块周围有一个样式标签...
java - 如何从 jSoup 元素创建一个数组?(爪哇)
如何获取一段 Html (values="valueIWant") 中的值,并将它们放在 Array 中?我尝试了以下方法,但没有奏效:
所以有人有答案吗?谢谢。(顺便说一句,我使用 Jsoup)
android - Android jSoup 帮助
我正在尝试使用 jSoup从这个 url http://skyalipi.blogspot.com/2011/04/there-is-no-resistance-without.html解析 html。我正在使用此代码
在日志中,我得到以下信息
我想获取段落内容。我不知道我哪里出错了。我也参考了以下网址http://jsoup.org/cookbook/extracting-data/attributes-text-html请帮忙