问题标签 [jtidy]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
3000 浏览

java - JTidy Node.findBody() — 如何使用?

我正在尝试使用 JTidy 进行 XHTML DOM 解析,这似乎是一项违反直觉的任务。特别是,有一种解析 HTML 的方法:

为了得到那个节点的 <body />,我想,我应该使用

我应该在哪里获得该 TagTable 的实例?(构造函数是受保护的,我还没有找到生产它的工厂。)

我使用 JTidy 8.0-SNAPSHOT。

0 投票
1 回答
252 浏览

java - xpaths在java中不起作用

我正在尝试访问一个 url,从中获取 html 并使用 xpaths 从中获取某些值。我得到的 html 很好,Jtidy 似乎正在适当地清理它。但是,当我尝试使用 xpaths 获取所需的值时,我得到一个空的 NodeList。我知道我的 xpath 表达式是正确的;我已经以其他方式对其进行了测试。这段代码有什么问题。谢谢您的帮助。

0 投票
2 回答
1988 浏览

java - JTidy 升级破坏了文档 xpaths

我刚刚更新到 10 月发布的最新版本的 jtidy,它似乎由于未知原因破坏了我的文档对象。这是我的代码:

这是我得到的错误:

尝试生成 NodeList 时,错误发生在最后一行代码。新版本的 JTidy 有人遇到过这样的问题吗?

0 投票
2 回答
1537 浏览

java - 如何最好地将 JTidy 与 Spring servlet 容器一起使用?

我有一个使用 Spring Framework 的 Java servlet 容器。页面是从 JSP 生成的,使用 Spring 将所有内容连接起来。发送给用户的结果 HTML 并不像我想要的那样整洁。我想在将 HTML 发送到客户端浏览器之前将其发送到 Tidy。

我会将其设置为在开发中工作并在生产中关闭;从我的角度来看,它是一个赢家,因为它会让我更容易维护。

关于如何在 Spring 中干净利落地工作的建议?

0 投票
1 回答
2457 浏览

html - 在 Maven2 中使用 JTidy

我正在使用 spring2 和 Maven 开发一个 Java 项目。

我已经将 JSLint4Java 合并到 Maven 中,但现在发现自己需要做一些进一步的验证。

构建中有许多核心页面,即主页、搜索页面等,我想自动测试最终 HTML 输出的规范有效性,即来自 Maven 构建的 Valid XHTML 1.1 strict。生成最终 HTML 输出的 html 模板文件都是模块化和分离的,因此单独验证组件将不起作用,因为它们在作为一个组件执行之前不会生效。

我不想测试构建中的每个页面,因为这会大大减慢它,我的偏好是有一个 XML 配置文件,其中包含我希望通过验证过程运行的 URL 列表。

我找到了 Jtidy 项目,但不确定如何将其合并到 Maven 构建中并让它调用特定的 URLS 进行验证。

以前有人做过吗?有人可以简要介绍我需要执行此操作的阶段吗?

干杯

0 投票
3 回答
3303 浏览

java - 任何人都可以发布 jtidy 的教程链接以将 xhtml 转换为 xml

任何人都可以提供使用 java 中的 jtidy 将 xhtml doc 转换为 xml 的示例程序。

或以其他方式发布使用 jtidy 的教程链接

0 投票
4 回答
20463 浏览

java - 如何在 Java 中更改 HTML 标签内容?

如何更改 Java 中标签的 HTML 内容?例如:

前:

后:

我试过 JTidy,但它不支持getTextContent. 还有其他解决方案吗?


谢谢,我不想解析格式良好的 HTML。我试过 TagSoup,但是当我有这个代码时:

我想将“sometext”更改为“someAnotherText”,当我使用{bodyNode}.getTextContent()它时给我:“sometext text”;当我使用setTextContet("someAnotherText"+{bodyNode}.getTextContent())并序列化这些结构时,结果是<body>someAnotherText sometext text</body>,没有<div>标签。这对我来说是个问题。

0 投票
3 回答
10792 浏览

java - 正确使用 JTidy 来净化 HTML

我正在尝试使用 JTidy (jtidy-r938.jar) 来清理输入的 HTML 字符串,但我似乎无法正确设置默认设置。通常,诸如“hello world”之类的字符串在整理后会变成“helloworld”。我想展示我在这里做什么,任何指针都将不胜感激:

假设这rawHtml是包含输入(真实世界)HTML 的字符串。这就是我正在做的事情:

首先,上面的代码看起来有什么根本错误吗?我似乎得到了奇怪的结果。

例如,考虑以下输入:

<p class="MsoNormal" style="text-autospace:none;"><font color="black"><span style="color:black;">???</span></font><b><font color="#7f0055"><span style="color:#7f0055;font-weight:bold;">private</span></font></b><font color="black"><span style="color:black;"> String parseDescription</span></font><font>

输出是:

<p class="MsoNormal" style="text-autospace:none;"><font color= "black"><span style="color:black;">&nbsp;&nbsp;&nbsp;</span></font> <b><font color="#7F0055"><span style= "color:#7f0055;font-weight:bold;">private</span></font></b><font color="black"><span style="color:black;">String parseDescription</span></font></p>

所以,

“公共字符串解析描述”变为“公共字符串解析描述”

提前致谢!

0 投票
1 回答
440 浏览

html - JTidy:如何处理特定标签

我正在使用 JTidy 处理格式错误的 HTML 页面。我只对修复一组特定的标签感兴趣,例如<img> <table>. 有没有办法告诉 JTidy 只关注那些标签?

0 投票
1 回答
750 浏览

java - Android SDK 和 XQuery?

是否有任何已知可与 Android SDK 一起使用的 XQuery 实现?我尝试了 mxquery,但没有运气。我没想到它会起作用,因为他们的网站说 Andriod 支持即将推出。

我正在取消 jTidy 以将网页解析为 XHMTL,并且正在寻找一些精简且快速的东西来搜索、过滤和重新格式化 XML 文件。

谢谢。