问题标签 [jtidy]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
jtidy - 通过 JTidy 转义转换丹麦字符
我正在使用 JTidy 将 HTML 页面解析为 XHTML。HTML 包含丹麦字符,然后 JTidy 将它们转换为某些特定字符。
例如:单词“Observér”被转换为“Observér”。
有没有办法避免这种情况?
java - JTidy doctype 错误块解析
我一直在尝试使用 JTidy 抓取一些在线内容,但我遇到了这个烦人的错误,我不知道如何修复它或让 JTidy 忽略它:
这似乎是一个愚蠢的错误 - 并且没有其他错误,所以这似乎是阻止 JTidy 解析文档的错误。我直接从 HttpURLConnection 的 InputStream 解析它,并且我使用 Tidy.parseDom 方法。
java - 如何在 JTidy 中设置 XML prolog 的编码属性?
我需要使用 JTidy 从 HTML 文件生成 XML。源的编码是GB2312,所以我需要将生成的XML的编码也设置为GB2312。
当前的 XML 序言:
我需要的:
我怎样才能做到这一点?
java - 我可以将 JTidy 配置为忽略某些错误和警告吗?
我正在使用 JTidy 来验证在 Java 中生成的 HTML 片段的渲染类。我想忽略某些警告和错误。
(编辑:重新考虑我可能不想抑制错误)
例如,生成的以下代码段:
导致此警告:
line 5 column 7 - Warning: img lacks "alt" attribute
我可以将 JTidy 配置为忽略特定检查,例如此项检查吗?
我用来检查的方法是:
xslt - 使用带有 html 到 xsl-fo 的样式
我正在将 HTML 字符串转换为 xsl-fo,然后将其输出为 PDF。我有几个在 PDF 中显示的表格,由于缺少 CSS 规则,它们被挤得太紧。我试图在 HTML 样式属性中指定我的(非常简单的)CSS 边距底部和边框,但它不起作用。我认为它不起作用,因为我用来解释样式的 xsl-fo XSL 样式表中没有规则。我正在使用此处找到的样式表。有谁知道如何以 xsl-fo 方式使用 HTML 样式属性(或 CSS 规则)?链接将不胜感激。我过去曾使用过 XSL,但我生疏了,而且我有些困惑,因为我现在要从 XHTML->PDF 开始,而过去我使用 XSL 从 XML->HTML 开始。
java - JTidy java API toConvert HTML to XHTML
我正在使用 JTidy 从 HTML 转换为 XHTML,但我在我的 XHTML 文件中找到了这个标签
。我能阻止它吗?
这是我的代码
java - Java: Jtidy convertion from html text to xhtml text
I am using JTidy i want to give it a string as an input instead of a file. Is that possible? How i can do that?
This is my code:
java - JTidy 和布尔属性
有像下一个这样的单选按钮,
经过整洁的解析后,我的节点只有 3 个属性,以及它的问题。如何配置 tidy 来解析布尔属性?谢谢。
PS我的整洁配置:
谢谢!
java - 使用 JTidy 从 html 中删除所需的标签
我在解析 HTML 时使用 JTidy 和 xpath,但暂时解析文本给我带来了一些麻烦,因为它可能包含 b 标签,所以我不想循环它的子节点,而只是在之后删除'b'标签它加载html。
如果从 DOM 文档中,如何删除标签。
例如它的伪代码 -doc.removeTag('<b>');
可能吗 ?