问题标签 [htmltidy]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
4 回答
2373 浏览

php - 配置 HTML Tidy 以在 html 属性中忽略 PHP 短开始和结束标记

当用作 html 属性中的值时,如何防止 HTML Tidy 转换 PHP 短标签?

这是它当前所做的一个示例。它转换这个:

对此:

我希望 HTML Tidy 忽略 PHP 短标签。任何改变这一点的配置选项?

==

为了简化,有没有办法让 HTML Tidy 避免进行 HTML 实体转换?如果它只是不转换<和>,那将解决我的问题。

0 投票
1 回答
2196 浏览

.net - 如何在 PowerShell 中使用 HTML Tidy .NET DLL 包装器?

我正在尝试在 PowerShell 2.0中使用HTML Tidy .NET 包装器。

这是一个使用 C# 的工作示例(包装分发中包含的 TestIt.cs):

我在 PowerShell 中这样做:

我收到以下错误:

附加信息:

这是怎么回事?

0 投票
1 回答
294 浏览

html - HTML Tidy 许可证问题

我正在寻找使用 HTML Tidy 源代码并对其进行修改以添加更多功能。阅读许可证后,我不太确定是否必须发布修改后的应用程序的源代码?我不想。

0 投票
1 回答
1354 浏览

html - html tidy 和 rails 应用程序 - erb 或 rthml 文件。红宝石替代品?

我刚刚为 Eclipse 安装了 HTML Tidy 插件。我添加了 html.erb 文件类型,现在它将对我的 erb 文件发挥作用。然而,它放入了标题标签并将我的许多角色更改为转义字符。我怎样才能阻止这种情况发生 - 或者是否有一个 ruby​​ 替代方案可以通过我的代码、重新缩进并粘贴丢失的标签?我很担心我的很多 erb 文件,因为带有 Aptana 的内置格式化程序很难使用。当我查看该页面时,我没有看到任何明显的错误,但我确定有一些不匹配的标签和我想摆脱的东西。有什么建议吗?

0 投票
3 回答
1681 浏览

html - 如何修复不合规的 HTML,以便 Expat 解析它(htmltidy 不起作用)

我正在尝试从http://www.nfl.com/scores抓取信息(特别是,找出游戏何时结束,以便我的计算机可以停止记录)。我可以很容易地下载 HTML,它声称符合标准:

  1. 尝试用Expat解析它会产生错误not well-formed (invalid token)

  2. W3C 的在线验证服务报告399 个错误和 121 个警告。

  3. 我尝试tidy使用该选项在我的 Linux 系统上运行 HTML tidy(刚刚称为 )-xml,但 tidy 报告 56 个警告和 117 个错误,并且无法恢复良好的 XML 文件。错误如下所示:

    但是当我检查输入时,“未知实体”似乎是正确引用的 URL 的一部分,所以我不知道某处是否缺少双引号或什么。

我知道有一些东西可以解析这些东西,因为 Firefox 和 w3m 都显示了一些合理的东西。 什么工具可以修复不兼容的 HTML,以便我可以用 Expat 解析它?

0 投票
1 回答
1487 浏览

c# - .NET 版本的 HTML Tidy?

有谁知道是否有可用于 .NET 的 HTML Tidy 的本机端口?在 Sourceforge 中,有一个 TidyNet 项目——它自 2005 年以来就没有更新过,看起来只是一个包装器。Java 端口似乎作为最近的 JTidy 项目存在。

HTML Tidy 项目页面: http ://tidy.sourceforge.net/

0 投票
2 回答
1713 浏览

php - 使用 Tidy 清理 HTML,HTML 内容被更改,编码问题?

我正在从 smarty 模板中获取 HTML 并需要对其进行清理(只是想删除多余的空格,并很好地格式化/缩进 HTML),我正在使用 tidy 来执行以下操作:

虽然这适用于英语,但多语言支持似乎打破了这一点。例如,我在 $html 中有阿拉伯字符,但整理后我得到了一些讨厌的编码:

هل أنت متأكد أنك تريد

是否有一个 tidy 设置可以格式化 HTML,但不考虑 HTML 本身?我看了这篇文章:PHP "pretty print" HTML (not Tidy)但似乎这行不通,因为我是从 smarty 那里获取我的 HTML 的。

任何建议表示赞赏。

0 投票
3 回答
1026 浏览

java - 通过htmltidy feed渲染的jsp页面

我有一个在 Glassfish 上运行的 Java 项目,它呈现一些难看的 HTML。这是使用各种内部和外部 JSP 库的副作用。我想设置某种后渲染过滤器,它可以通过 HTMLTidy 提供最终的 HTML,以便源代码很好且整洁,以帮助调试。这可能吗?

在服务器将 JSP 呈现为 HTML 后,是否有内置机制来执行某些操作?该操作可以将生成的 HTML 作为字符串获取并对其进行操作吗?是否有一些简单的内置选项可以在没有额外编码的情况下做到这一点?

0 投票
4 回答
5744 浏览

c++ - 是否有 HTML Tidy 的替代品?

我在我的应用程序中嵌入了 HTML Tidy 来清理传入的 HTML。但是 Tidy 有大量的错误,直接在源代码中修复它们是我最糟糕的噩梦。整洁的源代码是不可读的可憎之物。数千行函数,糟糕的变量命名,意大利面条代码等。这真是太可怕了。

更糟糕的是,官方开发似乎已经停止。在过去的 12 个月里,官方 CVS 回购中有3笔写交易。但它已经死了,埋葬的时间比这要长得多……

所以我正在寻找一个 OSS C 或 C++ 应用程序/库,它可以做 Tidy 可以做的事情(当感觉像它时):修复错误的 HTML 标记并将其转换为有效的 XHTML(这是我感兴趣的部分)。我的意思是各种不好的标记。

那里有类似的东西吗?

编辑:我既需要它来通过 XML 处理工具对 DOM 树进行操作,又需要它来普遍遵守 XHTML 规范。我的应用程序需要接受来自用户的 HTML(这通常以各种方式无效)并输出有效的 XHTML。它需要能够处理通常不会在浏览器中显示的 HTML,因为用户手动编辑它并且事后没有检查。

Tidy 的纠错解析器的替代品......这并不糟糕。如果源代码可读并且我可以自己修复问题,或者如果有活跃的开发人员及时提供错误修复,我不介意错误。

0 投票
1 回答
1536 浏览

gwt - 用于 Google Web Toolkit (GWT) 的漂亮打印/HTML Tidy?

GWT(Google Web Toolkit)是否有一个功能可以漂亮地打印小部件的 html 输出?(如果问题措辞不当,我们深表歉意——我不是 GWT 开发人员,但我们的开发人员声称无法做到这一点)

目前所有的输出都是一个巨大的单行块,使得调试 CSS 问题等成为一项艰巨的任务。

HTML Tidy / Pretty Print,至少在测试期间,会有很大帮助。