问题标签 [jsoup]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
java - 使用 Jsoup 解析 HTML 字符串时出错
我正在制作一个 Android 应用程序,我正在使用 JRE 6 和最新的 jSoup 库。我正在尝试使用以下方法解析包含 HTML 的字符串:
我得到以下异常:
java.lang.NoSuchMethodError java.lang.string.isEmpty
我该如何纠正这个问题?
java - 读取 JSON 内容
我正在使用 jsoup 来抓取一些 HTML 数据,效果很好。现在我需要提取一些 JSON 内容(只有 JSON,不是 HTML)。我可以使用 jsoup 轻松做到这一点,还是必须使用另一种方法来做到这一点?jsoup 执行的解析是对 JSON 数据进行编码,因此无法使用 Gson 正确解析。
java - Jsoup 获取部分页面
我正在尝试抓取投标网站的内容,但无法获取网站的完整页面。我在 xulrunner 上使用 crowbar 首先获取页面(因为 ajax 以惰性方式加载某些元素),然后从文件中抓取。但是在 birivals 网站的主页上,即使本地文件格式正确,这也会失败。jSoup 似乎只是在 html 代码中间以“...”字符结尾。如果有人以前遇到过这种情况,请帮助。[此链接]调用以下代码。
java - 如何从 Java 中的网页获取信息?
有谁知道我可以从 Java 网页获取信息的快速方法?例如,如果我正在查看这样的页面:http ://www.ncbi.nlm.nih.gov/pubmed/?term= 10952317 并且我想提取标题“MeSH 术语”下方的单词列表,我该怎么做呢?
我有一些可以阅读源代码的东西,但它充满了 HTML 标记等......
任何帮助深表感谢!
jsoup - Jsoup 解析带有 tbody 标签的 Html 文件
我最近在 tbody 标记方面出现了不一致的 Jsoup 行为,当我使用 Html 结构解析 Web 上的远程页面时,例如:
Jsoup 在 select method() 返回的元素中不包含 tbody 元素。
我使用方法 connect().get() 将远程页面加载到 Document 变量中,例如:
但是当我解析本地磁盘上的同一页面时(在我下载之后)。Jsoup 包含 tbody 标签。我的表达式将不再起作用,因为它缺少 tbody 元素。
我用:
我的 Jsoup 表达式仅适用于第一种情况。
有没有办法强制 Jsoup 识别 tbody 元素(或删除它),以便在两种情况下都可以使用相同的表达式?
这是 Jsoup 的正常行为吗?
我是否也应该在解析本地页面时使用 connect 方法?
java - jsoup 发布和 cookie
我正在尝试使用 jsoup 登录一个站点然后抓取信息,我遇到了一个问题,我可以成功登录并从 index.php 创建一个文档,但我无法获取站点上的其他页面。我知道我需要在发布后设置一个 cookie,然后在我试图打开网站上的另一个页面时加载它。但是我该怎么做呢?以下代码让我登录并获取 index.php
我知道我可以使用 apache httpclient 来做到这一点,但我不想这样做。
java - 如何处理我的应用程序中的网页内容
我的系统(我正在使用 JSP)处理网络上的现有网站。我的应用程序应该能够显示该网站的页面并进行一些更改,例如突出显示某些单词。
因此,我的程序将做的是从该网站获取页面并突出显示一些特定的单词,然后再次向我的系统用户显示带有突出显示的单词的页面。
我怎么能用java做到这一点?
android - Android中get()的Jsoup错误
我试图在我的 Android 应用程序中使用 Jsoup 1.6.0,但由于某种原因它崩溃了。我将代码简化为:
但是,每当我在手机(USB 调试模式)或模拟器上运行上述程序时,我都会收到我的程序意外崩溃的消息——甚至没有发现错误。如果我将 try 块的内容替换为
该程序运行良好,所以似乎 get() 方法导致了问题......
仅供参考,在我的 AndroidManifest.xml 中我确实包含了
在正确的位置,并且 R.layout.main 是 ADT 在您创建新项目时生成的默认布局。我正在为这个项目使用 Android API 7 级。我怎样才能让它工作?
java - 当Jsoup解析只包含“0”的Html标签时,会返回null吗?
我用的是jsoup-1.6.0,解析html标签字符串,只包含字符串内容“0”,但是jsoup返回null,我明白...
例如:
这是为什么?
回答:
应该是bug,binary_runner说jsoup-1.3.3运行良好,我测试jsoup-1.5.2也运行良好。所以,我决定使用 jsoup-1.5.2 。
感谢 binary_runner!
android - 在 Android 中处理 Web 上的数据
我是一名新的 Android 程序员,我的问题是:
我想从 HTML 文件中获取一些信息。下载它并以舒适的方式解析它的最佳方式是什么?
谢谢!