问题标签 [htmlcleaner]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
394 浏览

java - java htmlcleaner在清理时崩溃

嗨,在我的代码中,我运行以下几行,但此代码在执行期间崩溃。

这是错误的堆栈跟踪:

任何人都可以帮助找出它发生的原因吗?

真诚的,佐利

0 投票
0 回答
241 浏览

java - 无需整理源代码的 HTML 解析器

我的机器上有数百个旧的 html 文件,我正在尝试解析和提取一些数据。我尝试了不同的 Java 解析器,包括 Jsoup、Tagsoup、HTMLcleaner、JTidy 等。由于 html 代码在文件中的方式,我只能使用支持 XPATH 的解析器,尝试了 Jsoup,但找不到等效的 css 选择器。

无论如何,我的问题是无论我尝试什么解析器,都会清理实际内容并将 ' (撇号)之类的东西转换为奇怪的字符。

是否可以使用任何 Java 解析器解析内容而无需整理和替换特殊字符?

0 投票
1 回答
147 浏览

java - 如何正确获取 HTML Asset

我一直在关注使用 HtmlCleaner 解析 HTML 的教程,特别是这个:http: //xjaphx.wordpress.com/2012/02/04/android-xml-adventure-parsing-html-using-htmlcleaner/

有一部分代码获取了一个 url 并修改了该页面的 html:

如何正确保存网页,将其存储为资产并实现相同的目标?

谢谢

0 投票
1 回答
405 浏览

xpath - 获取特定节点元素下的节点

我需要帮助解决这里的问题,或者至少需要一些建议。我正在使用带有 XPATH 的 HTMLcleaner 解析 HTML 文档。

我有这样的事情:

好的。我有几个<h4>标签,每个标签都有<a>标签和一些文本。我的问题是我不知道如何从特定的文本中获取所有相应的文本,就像“h4 [i]”一样。我尝试了这样的事情,但没有奏效:

谢谢你的建议对你的帮助!

0 投票
1 回答
603 浏览

android - 使用 HTMLCleaner 解析文本的问题 - 文本开头的空格

我可以使用 HTMLCleaner 从网站获取文本。问题是,当我将文本设置为 TextView 时,它会显示文本的开头,上面有很大的空格。截屏

我试过android:gravity了,但什么也没发生。

请帮忙。

这是我的代码:

0 投票
1 回答
844 浏览

android - 如何处理
HTMLCleaner 中的标签?

使用 HTMLCleaner 解析时,所有“br”标签都将被忽略。我想知道如何处理“br”标签。

这是一个例子:

输出是被清理的 br 标签。

有任何想法吗?请我需要帮助。

提前致谢。

0 投票
2 回答
863 浏览

java - 在 HTML 文件的 XPath 处提取 HTML

我正在尝试从给定 Xpath 的文件中获取 html 代码。我尝试使用 HTMLUnit,但它似乎不能很好地处理从谷歌缓存下载的这些静态文件。我在使用 HTMLCleaner 时运气好一点,但到目前为止,我只能获取文本而没有 HTML 代码。任何的意见都将会有帮助。以下是我目前正在使用的代码。

0 投票
2 回答
1005 浏览

android - AsyncTask 中的 HTMLcleaner

我正在尝试使用 HTML 清洁器来解析来自网站的信息,然后使用 Xpath 来查找我正在寻找的数据。我在一个单独的 AsyncTask 类中有 htmlcleaner 的东西,该应用程序似乎可以在我的手机上运行。但是,当我按下按钮时,什么也没有发生。这是我的主要活动类和我的 AsyncTask 类。

这是我引用的课程。如果有人能看到这个并告诉我发生了什么,我将不胜感激。我试图遵循一个工作示例并将我自己的 Url 和 Xpath 放入,但它不起作用。

0 投票
2 回答
492 浏览

android - HTMLcleaner 堆栈跟踪错误

我正在做一个项目并且遇到了一个问题。我正在尝试使用 html 清理器解析 html,然后使用 xpath 返回一个字符串。如果发现错误(确实如此),我让它返回一个堆栈跟踪。我真的不知道如何根据堆栈跟踪进行调试。这是代码。

这是我的 HTML 助手类

UI 和加载栏工作正常,但 TextView 不断返回 [Ljava.lang.Object;@42455a88

我真的很感激这方面的一些帮助......我整天都在努力解决它,但似乎无法弄清楚。谢谢!

0 投票
2 回答
195 浏览

java - if else 语句

我有一个包含几个 if/else 语句的代码。但是,每当抛出“else”案例时,所有后续语句也会导致“else”。这是代码,我会很感激一些帮助!

如前所述,当抛出第一个“else”语句时,就会出现问题。如果第一种情况是“if”,第二种情况是“else”,那么第三和第四种情况也将是“else”