问题标签 [htmlcleaner]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
894 浏览

java - 一起使用 HtmlCleaner 和 Jsoup 是个好主意吗?

所以我试图从某个网站获取一些数据。当应用程序首次启动时,它会下载某个网站的 html 文件并对其进行清理。

现在我知道我可以使用 XPath 使用 HtmlCleaner 来解析 html,但我对 XPath 一无所知。我很确定在清理文件后用 Jsoup 解析它会更容易。这个可以吗?

0 投票
1 回答
148 浏览

android - AsyncTask 的 HTMLCleaner 中的超时

我在AsyncTask中使用HTMLCleaner来解析站点。如何在 HTMLCleaner 中设置超时或超时 AsyncTask?怎么休息?

0 投票
0 回答
830 浏览

java - 使用 HtmlCleaner 从脚本标签中解析 HTML 标签

我正在使用 HtmlCleaner 来解析 html 文档并遇到了一个小问题:

htmlcleaner 属性指南上,它说如果我将 useCdata 标志设置为 false,它将在脚本和样式标签中搜索 html。好的,我来了:

htmlcleaner 不应该找到 h1 吗?为了使事情更加混乱,以下工作正常:

或者

???

0 投票
1 回答
1191 浏览

android - 我如何检索里面的文本

我想提取下面粘贴的 HTML 页面部分中存在的文本“Catholic Blended Margaritas”。

我同样使用了以下 xPath 表达式:

我将它传递给 HTMLCleaner,我将其部分代码粘贴在这里:

但是上面的表达式返回零节点。

我已经粘贴了 Html 的部分。事实上,我想要所有这些节点的文本,我只粘贴了 Html 的一部分。供您参考的 HTML 页面链接如下:http ://www.foodfood.com/category/recipes/by-course/beverages/

上述链接部分Html如下:

请注意文本“Catholic Blended Margaritas”(我想要的)嵌套在两个<div>标签内,这给我带来了问题。

0 投票
7 回答
568 浏览

html - 如何在 HTML 中添加匹配的开始标签

我的 html 内容看起来像

我想解析这个 html 片段并在 Hello 之前添加一个起始 div 标记。我可以遵循什么方法?我尝试使用HTMLCLeaner但它没有帮助基本上这意味着找到结束 div 标签而不匹配开始 div 标签并添加它们。

0 投票
2 回答
1109 浏览

android - 从网页上的表(类)中检索数据以在 android 中使用

我想从网站http://www.mtn.co.ug/Mobile-Plans/PayAsYouGo/MTN-PerMinute.aspx检索表中包含的数据并将其用于 android 应用程序,以便在更新时,信息在应用程序中也更新了。但是,我对android不是很熟悉。所以我需要帮助来使用 htmlcleaner 和 jsoup/json 检索数据。

谢谢。

0 投票
1 回答
260 浏览

html - 清理大型项目中已弃用的 HTML

我正在使用 Visual Studio 2012 中的一个项目,该项目中充斥着弃用的 HTML 标记。这会导致大量 Visual Studio 警告。其中大量是align属性标签广泛使用的结果。

所以我确实看到了数百个以下警告:

执行站点范围更新以将其转换为内联 CSS 样式的最佳方法是什么?我已经尝试了查找替换正则表达式,但某些元素已经具有样式定义,因此正则表达式方法会导致重复的样式标签。

是否有 Visual Studio 扩展可以为我自动执行此清理操作?我看过ReSharperCodeMaid,但不确定它们是否能胜任?

编辑:

我还有以下不推荐使用的 html 属性,我希望将其重新定位到样式标记。

0 投票
2 回答
1214 浏览

java - HtmlCleaner 使用 ContentNodes 并修改文本内容

我正在使用带有 ColdFusion 的 HtmlCleaner。在下面的代码中,我正在遍历节点树并寻找内容节点。我想要做的是能够修改节点的文本内容。

我正在使用的示例是:

0 投票
1 回答
342 浏览

android - 如何从