1

我使用了一些疯狂的外星人技术* 将我的 HTML 内容转换为 Jekyll 的 markdown。

我注意到有些文件的 HTML 无效。有大量文件,因此没有人可以快速手动查看所有文件。

有没有一种方法可以快速列出所有带有无效 HTML 的文件而忽略降价内容?可能使用 Windows 应用程序?

*应用程序

4

2 回答 2

1

您应该尝试HTML Tidy ,在解析之前使用tidy清理它。

于 2014-07-26T08:30:04.413 回答
0

例如, Pandoc似乎通过了 markdown 输入中包含的无效 html。将 Pandoc 的 HTML 输出传递给HTML Tidy 进行验证。就像是:

$ pandoc input.md | tidy
于 2014-07-27T09:46:30.753 回答