问题标签 [htmltidy]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
2335 浏览

php - HTML Tidy 后网页上的奇怪字符

我正在通过 Amazon Web Services 获取内容(例如产品描述)。由于来自亚马逊的内容通常标记得很差,最终会弄乱我的网页布局。所以,我想出了一个使用 HTML Tidy 来“清理”内容的功能。

奇怪的是,当我将它与我的应用程序分开测试时,一切似乎都运行良好。但在我的应用程序(在 CodeIgniter 上运行)中,该函数似乎返回奇数字符。

下面的代码是我的测试脚本。它输出我认为我需要的东西。

在我的应用程序中,我从数据库中获取描述,对其进行清理,然后将其显示在我的网页上。例如,在清理之后,document’s(您可以在下面的示例中看到这个词)变为document’s(再次,仅在实际应用中;不在测试代码中。两个功能是相同的)。

任何想法为什么?这是我的测试功能:

更新:

这是我在我的应用程序中得到的:

这是我在应用程序之外得到的:

0 投票
1 回答
532 浏览

iphone - iOS - 有没有清理 HTML 代码的好方法?

在我的应用程序中,我从网络中提取了一些 HTML 内容。有时该标记不是看起来最有效的代码,我想清理它(修复标记错误等),类似于 HTMLTidy 的工作方式。

有人提到了 libTidy,但我没有发现如何使用它,所以让我问一下,清理 HTML 以在 iOS 中更有效的最佳方法是什么?

0 投票
2 回答
1019 浏览

iphone - 将 TouchXML 与 HTML Tidy 结合使用

我正在尝试在我的 iPhone 应用程序中设置 TouchXML 以解析网站中的 HTML,但不幸的是,该网站的 HTML 不是有效的 XML。我想用 HTML tidy 来整理一下,实际上 TouchXML 有一个设置,TOUCHXMLUSETIDY,打开时实际上是这样做的。但是当我打开此设置时,我收到以下错误:Tidy.h: No such file or directory found.我的目标中安装了 libtidy.dylib,并尝试下载 HTML Tidy 源并将其直接放入我的应用程序,但没有任何效果。有关如何在 iPhone 上将 HTML 整理成有效 XML 的任何建议?

0 投票
3 回答
919 浏览

c# - 在 .NET 中整理 HTML 的解决方案

人们是否认为.NET需要一个很好的HTML Tidy类似物?

我正在寻找一个产品来做一些事情,比如过滤文档的 HTML 语法,执行各种任务,例如:清理 Microsoft Word 生成的 HTML,将 HTML 转换为 XHTML,去除某些元素等。

HTML 整洁器还可以预期哪些其他可能的常见功能?

0 投票
1 回答
402 浏览

html - HTML Tidy - 如果缺少引号,则不会发出警告

如果属性值周围缺少引号,我是否可以设置任何选项来整齐地向我显示警告?目前我运行整洁如下:

test.html

没有警告,但实际上 XML 需要引号。我不需要更正后的输出。我想使用-e选项。

2009 年 3 月 25 日发布的适用于 Windows 的 HTML Tidy

0 投票
0 回答
222 浏览

htmltidy - 关于脚本标签的htmltidy问题

可能重复:
如何让 HTML Tidy 在关闭标签之前不放置换行符?

htmltidy我用了几天了,但是在使用的时候总会出现一个“bug”。这个错误会自动包装我的脚本标签!!

我不得不提一下,它们只是内联脚本,只链接到外部脚本。

搜索了高级的整洁命令后,我仍然无法解决这个奇怪的问题。有没有人遇到过这种情况?

我的个人配置

我未整理的 test.html

我整理的 test.html

0 投票
1 回答
276 浏览

javascript - 整洁:避免移动脚本标签

我正在使用这种代码:

使用 HTML tidy 后,脚本标签被移除到表格之外,因此破坏了页面布局。我知道,这段代码不是最先进的。然而,在不手动重新布线我的页面的情况下,我可以做些什么来整理它?

谢谢

0 投票
2 回答
1125 浏览

unicode - HTML Tidy 处理的希伯来字符变成乱码

我正在使用 HTML Tidy Online ( http://infohound.net/tidy/ ) 来整理一些非常陈旧且混乱的 HTML 文件,其中包含一些希伯来语字符。每当 Tidy 处理页面时,即使在设置中更改编码方法后,输出也会将希伯来字符变成乱码。使用不同的设置,我确实设法将希伯来字符作为 unicode 实体获得相同的输出。我用谷歌搜索了一个可能的解决方案,但没有找到。我有几个想法,但我不确定如何接近它们,如果有的话(也许有人有更好的解决方案)。

  1. 我想也许我可以(在处理页面之后)扫描页面以查找 unicode 实体并将它们替换为相应的希伯来字符(当然是以系统的方式)。
  2. 也许我可以获取 HTML Tidy 源代码并对其进行修改以适当地输出希伯来语字符。问题在于,我怀疑我是否知识渊博,甚至可以开始做这样的事情。
0 投票
5 回答
16978 浏览

php - php tidy 的替代方案?

我使用 php tidy 处理数据库中的 html 输入,

我在我的服务器上打开了这个 php_tidy 但我的实时服务器不支持整洁,

致命错误:在第 587 行的 /customers/0/5/a/mysite.com/httpd.www/models/functions.php 中调用未定义的函数 tidy_repair_string()

我有什么办法可以解决这个问题吗?

0 投票
1 回答
364 浏览

javascript - html tidy 和 javascript 正则表达式

当 HTML Tidy 看到这个 HTML 时:

它生成

这会导致运行时错误:未终止的正则表达式文字。

有没有办法避免这种行为?谢谢