问题标签 [htmlcleaner]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
java - java htmlcleaner在清理时崩溃
嗨,在我的代码中,我运行以下几行,但此代码在执行期间崩溃。
这是错误的堆栈跟踪:
任何人都可以帮助找出它发生的原因吗?
真诚的,佐利
java - 无需整理源代码的 HTML 解析器
我的机器上有数百个旧的 html 文件,我正在尝试解析和提取一些数据。我尝试了不同的 Java 解析器,包括 Jsoup、Tagsoup、HTMLcleaner、JTidy 等。由于 html 代码在文件中的方式,我只能使用支持 XPATH 的解析器,尝试了 Jsoup,但找不到等效的 css 选择器。
无论如何,我的问题是无论我尝试什么解析器,都会清理实际内容并将 ' (撇号)之类的东西转换为奇怪的字符。
是否可以使用任何 Java 解析器解析内容而无需整理和替换特殊字符?
java - 如何正确获取 HTML Asset
我一直在关注使用 HtmlCleaner 解析 HTML 的教程,特别是这个:http: //xjaphx.wordpress.com/2012/02/04/android-xml-adventure-parsing-html-using-htmlcleaner/
有一部分代码获取了一个 url 并修改了该页面的 html:
如何正确保存网页,将其存储为资产并实现相同的目标?
谢谢
xpath - 获取特定节点元素下的节点
我需要帮助解决这里的问题,或者至少需要一些建议。我正在使用带有 XPATH 的 HTMLcleaner 解析 HTML 文档。
我有这样的事情:
好的。我有几个<h4>
标签,每个标签都有<a>
标签和一些文本。我的问题是我不知道如何从特定的文本中获取所有相应的文本,就像“h4 [i]”一样。我尝试了这样的事情,但没有奏效:
谢谢你的建议对你的帮助!
android - 如何处理
HTMLCleaner 中的标签?
使用 HTMLCleaner 解析时,所有“br”标签都将被忽略。我想知道如何处理“br”标签。
这是一个例子:
输出是被清理的 br 标签。
有任何想法吗?请我需要帮助。
提前致谢。
java - 在 HTML 文件的 XPath 处提取 HTML
我正在尝试从给定 Xpath 的文件中获取 html 代码。我尝试使用 HTMLUnit,但它似乎不能很好地处理从谷歌缓存下载的这些静态文件。我在使用 HTMLCleaner 时运气好一点,但到目前为止,我只能获取文本而没有 HTML 代码。任何的意见都将会有帮助。以下是我目前正在使用的代码。
android - AsyncTask 中的 HTMLcleaner
我正在尝试使用 HTML 清洁器来解析来自网站的信息,然后使用 Xpath 来查找我正在寻找的数据。我在一个单独的 AsyncTask 类中有 htmlcleaner 的东西,该应用程序似乎可以在我的手机上运行。但是,当我按下按钮时,什么也没有发生。这是我的主要活动类和我的 AsyncTask 类。
这是我引用的课程。如果有人能看到这个并告诉我发生了什么,我将不胜感激。我试图遵循一个工作示例并将我自己的 Url 和 Xpath 放入,但它不起作用。
android - HTMLcleaner 堆栈跟踪错误
我正在做一个项目并且遇到了一个问题。我正在尝试使用 html 清理器解析 html,然后使用 xpath 返回一个字符串。如果发现错误(确实如此),我让它返回一个堆栈跟踪。我真的不知道如何根据堆栈跟踪进行调试。这是代码。
这是我的 HTML 助手类
UI 和加载栏工作正常,但 TextView 不断返回 [Ljava.lang.Object;@42455a88
我真的很感激这方面的一些帮助......我整天都在努力解决它,但似乎无法弄清楚。谢谢!
java - if else 语句
我有一个包含几个 if/else 语句的代码。但是,每当抛出“else”案例时,所有后续语句也会导致“else”。这是代码,我会很感激一些帮助!
如前所述,当抛出第一个“else”语句时,就会出现问题。如果第一种情况是“if”,第二种情况是“else”,那么第三和第四种情况也将是“else”