4

简单的问题 - 我有一大堆肮脏的 html 页面要清理,我正在寻找一个开源或免费软件脚本/实用程序来删除任何垃圾并将它们重新格式化为布局良好的一致代码。有什么建议吗?

如果它是相关的,我通常会在 Dreamweaver 中操作 HTML - 但是通过编辑代码并使用所见即所得窗口作为预览而不是反之亦然 - 所以与 Dreamweaver 兼容的脚本将是一个加号。

4

11 回答 11

21

我不认为它可以插入 Dreamweaver 但每当我需要清理 html 时HTML Tidy就是我的首选

于 2008-09-27T10:25:42.370 回答
4

我第二个 HTML Tidy。
我只是想添加它是一个具有各种端口和绑定的库。因此,它也集成在一些编辑器中,如 HTML-Kit 或 NoteTab,并且它有一个 GUI 前端。所有这些都链接在上面给出的页面中。
另请注意,W3C 标记验证服务具有“使用 HTML Tidy 清理标记”选项(验证结果显示后)。

于 2008-09-27T10:33:32.290 回答
1

Dreamweaver CS3 在“命令”菜单项下有一个内置的“清理 HTML”选项。我不认为它几乎像 HTML Tidy 那样全面。

Adob​​e 网站

清理代码

您可以自动删除空标签、组合嵌套字体标签,并以其他方式改进混乱或不可读的 HTML 或 XHTML 代码。

有关如何清理从 Microsoft Word 文档生成的 HTML 的信息,请参阅打开和编辑现有文档。

  1. 打开一个文档:

    • 如果文档是 HTML,请选择命令 > 清理 HTML。
    • 如果文档是 XHTML,请选择命令 > 清理 XHTML。-- 对于 XHTML 文档,Clean Up XHTML 命令修复 XHTML 语法错误,将标签属性的大小写设置为小写,除了执行 HTML 清除操作之外,还添加或报告标签缺少的必需属性。
  2. 在出现的对话框中,选择任意选项,然后单击“确定”。-- 注意:根据文档的大小和选择的选项数量,完成清理可能需要几秒钟的时间。

删除空容器标签 删除它们之间没有内容的所有标签。例如,<b></b> 和 <font color="#FF0000"></font> 是空标签,但 <b>some text</b> 中的 &ly;b> 标签不是。

移除冗余嵌套标签 移除标签的所有冗余实例。例如,在代码<b>This is what I <b>really</b>想要说</b>中,围绕单词的b标签真的是多余的,将被删除。

删除非 Dreamweaver HTML 注释 删除所有不是由 Dreamweaver 插入的注释。例如,<!--begin body text--> 将被删除,但 <!-- TemplateBeginEditable name="doctitle" --> 不会,因为它是一个 Dreamweaver 注释,它标记了一个可编辑区域的开始模板。

删除 Dreamweaver 特殊标记删除 Dreamweaver 添加到代码中的注释,以便在更新模板和库项目时自动更新文档。如果您在清理基于模板的文档中的代码时选择此选项,则该文档将从模板中分离。有关详细信息,请参阅从模板中分离文档。

移除特定标签 移除相邻文本框中指定的标签。使用此选项可删除由其他可视化编辑器插入的自定义标签以及您不希望出现在您的网站上的其他标签(例如,blink)。用逗号分隔多个标签(例如,字体、闪烁)。

尽可能合并嵌套的 <font> 标签 当 它们控制相同的文本范围时合并两个或多个字体标签。例如,<font size="7"><font color="#FF0000">big red</font></font> 将更改为 <font size="7" color="#FF0000">big red </font>。

完成时显示日志显示一个警告框,其中包含有关清理完成后对文档所做更改的详细信息。

于 2008-09-27T16:58:11.320 回答
1

我使用HTML Formatter ...它完全符合您的要求。

于 2009-09-06T07:38:21.753 回答
1

我绝对认为最好的工具是 Logichammer.com 的HTML Formatter。它完全符合您的需求,而且使用起来非常简单。值得一试……这家伙甚至在他的网站上有一段视频,展示了它的易用性。我已经使用它两年了,没有它就活不下去了……我得到了很多乱七八糟的代码。

于 2010-03-12T19:38:54.083 回答
1

我使用Cleanup HTML它可以很好地清理和格式化 HTML

于 2011-03-04T14:11:17.490 回答
1

我建议purehtml.in ...它美化了 html、样式和 JavaScript 标签...

于 2012-02-22T06:17:16.213 回答
0

您甚至可以在现有的 HTML 到达浏览器之前通过 HTML Tidy 对其进行缓冲 - 如果它是一个低流量站点,那么这将使事情变得整洁而不费力。

于 2008-09-27T11:10:25.413 回答
0

我也推荐 HTML Tidy,虽然它不再由 Dave Ragett 维护,但该工具肯定会经常通过调整进行更新。

我使用HTML Trim这是一个 win32 应用程序来清理我们的一些开发人员敲掉的一些糟糕的自动生成的代码块。

您还可以获取可以集成到 Dreamweaver 中的命令行版本。

抱歉,我不能发布多个超链接 - 这里仍然是一个 n00b。

于 2009-09-06T07:52:42.347 回答
0

我已经使用Polystyle很长时间了,我很高兴。格式化规则相当灵活,成本约为 15 美元。提供试用版。

于 2011-01-15T13:18:26.613 回答
-1

我会推荐vim。您可以使用 v 格式化代码块以选择块,并使用 '=' 缩进代码。

于 2010-08-18T09:25:27.903 回答