问题标签 [jtidy]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
470 浏览

java - Jtidy & ITextRenderer are not giving right output

The output is Hello World1 in a single line. I want it to be in new lines as I used br tag. How to achieve this goal?

0 投票
1 回答
194 浏览

web-scraping - 如何在使用 HTML 单元解析 HTML 之前对其进行清理

我正在html使用 HtmlUnit 进行抓取,但它html的格式错误,几乎没有标签未关闭,因此 HtmlUnit 给出了错误的结果。所以我需要在将其传递给 HtmlUnit 之前对其进行清理。

我怎样才能做到这一点。

一个简短的代码片段或教程将不胜感激

0 投票
1 回答
128 浏览

servlets - ClassNotFoundException JTidy

我使用 myeclipse 来运行我的 servlet。在 doPost 函数中,有一句话Tidy tidy = new Tidy(); 但是,当我运行我的 servlet 时,我收到如下错误:

我已经这样做了import org.w3c.tidy.Tidy;

为什么会弹出这个错误?是不是因为我需要一些配置web.xml?如果是这样,我该怎么做?

0 投票
1 回答
389 浏览

java - 以编程方式验证 HTML 代码

我正在尝试验证StringHTML 代码。也就是说,当 HTML 代码语法错误时,我想知道,可能是return false.

我目前正在使用JTidy,但它并没有告诉我语法错误,它只是纠正了它。我不需要更正它,只需说出合成器的好坏。

JTidy 代码:

任何帮助都会得到帮助。

0 投票
1 回答
417 浏览

java - 从包含文本的父节点获取 NodeList

我想从其中一个包含特定文本的父节点获取所有子节点。换句话说:我在某个子节点上开始搜索,我确定该子节点包含我需要的一些字符串。一旦我找到它,我不需要从与相同 Xpath 表达式匹配的节点中获取所有其他字符串,而是需要在同一级别上获取其他节点。我正在使用 Java。例如:

如果我查找 IIND1000,我想获取该 tr 标签中的每个 td 元素(10110,IIND1000, 1, 3, INTROD.INGEN. INDUSTRIAL, 100, 100, 0)。这可能与 Jtidy 吗?有什么提示或建议吗?谢谢。

0 投票
0 回答
625 浏览

java - 如果找到元素,则停止 Jtidy 解析

有没有办法只下载和解析 XML 文档,直到使用 XPathExpression 找到一个元素?我正在使用 Java:

我从这样的 HTML 文档中获取文本:

因此,例如,一旦 XPathExpressionparams[1]=10110)在第一个表上找到代码 10110 ( ,那么我需要它不要下载下一个表。相反,只有来自同一级别的孩子的所有文本。通常的文档大小是超过 10k 行,如果搜索的元素位于最开始,它会在一段时间后变得低效。

0 投票
1 回答
132 浏览

java - 如何删除作为 XML 消息一部分的 XML 中的 < 和 >

我有如下所示的 XML:

XML 包含使 XML 无效的“<”字符。

现在最简单的方法是修复 XML 的源,但不幸的是我无法控制 XML 的创建。它有类似“The value is < than 10”的消息,假设是“小于”。

无论如何,我如何检查 XML 中的此类内容并转义这些字符?

我试着看这篇文章,那个人指出我们应该使用 JTidy。但是当我尝试它时,它并没有删除 <:

0 投票
1 回答
286 浏览

java - jtidy 不能很好地解析 freemarker html 代码

方法:

通过 htmlString 作为参数输入的内容:

在返回语句之前填充结果的内容:

我什至无法想象出了什么问题...任何帮助或指导?

0 投票
1 回答
2875 浏览

java - 如何使用 JTidy 验证 HTML?

我想使用 JTidy 验证我的 html。如果分别验证或不验证,我想回复真假。目前我正在使用此代码。

无论我的html是否有效,是否有任何方法或方式可以让我得到布尔响应?任何帮助都会得到帮助。

0 投票
1 回答
142 浏览

java - 在 JAVA 中删除 HTML 中的多余空间

需要执行一些 HTML 清理。

有很多多余的 br 标签的 HTML,到目前为止尝试 HtmlCleaner 和 jTidy 没有任何结果。

例子:

我想要的只是得到一个单一的<br>回报

还有其他方法可以在不逐行手动解析的情况下完成此操作吗?