问题标签 [jtidy]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
60 浏览

jtidy - 通过 JTidy 转义转换丹麦字符

我正在使用 JTidy 将 HTML 页面解析为 XHTML。HTML 包含丹麦字符,然后 JTidy 将它们转换为某些特定字符。

例如:单词“Observér”被转换为“Observér”。

有没有办法避免这种情况?

0 投票
0 回答
401 浏览

java - JTidy doctype 错误块解析

我一直在尝试使用 JTidy 抓取一些在线内容,但我遇到了这个烦人的错误,我不知道如何修复它或让 JTidy 忽略它:

这似乎是一个愚蠢的错误 - 并且没有其他错误,所以这似乎是阻止 JTidy 解析文档的错误。我直接从 HttpURLConnection 的 InputStream 解析它,并且我使用 Tidy.parseDom 方法。

0 投票
0 回答
298 浏览

java - 如何在 JTidy 中设置 XML prolog 的编码属性?

我需要使用 JTidy 从 HTML 文件生成 XML。源的编码是GB2312,所以我需要将生成的XML的编码也设置为GB2312。

当前的 XML 序言:

我需要的:

我怎样才能做到这一点?

0 投票
2 回答
723 浏览

java - 如何从 JTidy 中删除所有输出?

我正在使用 JTidy 清理一些 XML,如下所示:

问题是它总是输出以下内容:

我怎样才能防止它输出任何东西?我试过:

,如此处所示但这也不起作用。

0 投票
1 回答
1228 浏览

java - 我可以将 JTidy 配置为忽略某些错误和警告吗?

我正在使用 JTidy 来验证在 Java 中生成的 HTML 片段的渲染类。我想忽略某些警告和错误

(编辑:重新考虑我可能不想抑制错误

例如,生成的以下代码段:

导致此警告:

line 5 column 7 - Warning: img lacks "alt" attribute

我可以将 JTidy 配置为忽略特定检查,例如此项检查吗?

我用来检查的方法是:

0 投票
0 回答
513 浏览

xslt - 使用带有 html 到 xsl-fo 的样式

我正在将 HTML 字符串转换为 xsl-fo,然后将其输出为 PDF。我有几个在 PDF 中显示的表格,由于缺少 CSS 规则,它们被挤得太紧。我试图在 HTML 样式属性中指定我的(非常简单的)CSS 边距底部和边框,但它不起作用。我认为它不起作用,因为我用来解释样式的 xsl-fo XSL 样式表中没有规则。我正在使用此处找到的样式表。有谁知道如何以 xsl-fo 方式使用 HTML 样式属性(或 CSS 规则)?链接将不胜感激。我过去曾使用过 XSL,但我生疏了,而且我有些困惑,因为我现在要从 XHTML->PDF 开始,而过去我使用 XSL 从 XML->HTML 开始。

0 投票
3 回答
12908 浏览

java - JTidy java API toConvert HTML to XHTML

我正在使用 JTidy 从 HTML 转换为 XHTML,但我在我的 XHTML 文件中找到了这个标签 。我能阻止它吗?
这是我的代码

0 投票
1 回答
1996 浏览

java - Java: Jtidy convertion from html text to xhtml text

I am using JTidy i want to give it a string as an input instead of a file. Is that possible? How i can do that?

This is my code:

0 投票
1 回答
255 浏览

java - JTidy 和布尔属性

有像下一个这样的单选按钮,

经过整洁的解析后,我的节点只有 3 个属性,以及它的问题。如何配置 tidy 来解析布尔属性?谢谢。

PS我的整洁配置:

谢谢!

0 投票
1 回答
945 浏览

java - 使用 JTidy 从 html 中删除所需的标签

我在解析 HTML 时使用 JTidy 和 xpath,但暂时解析文本给我带来了一些麻烦,因为它可能包含 b 标签,所以我不想循环它的子节点,而只是在之后删除'b'标签它加载html。

如果从 DOM 文档中,如何删除标签。

例如它的伪代码 -doc.removeTag('<b>');

可能吗 ?