我使用了一些疯狂的外星人技术* 将我的 HTML 内容转换为 Jekyll 的 markdown。
我注意到有些文件的 HTML 无效。有大量文件,因此没有人可以快速手动查看所有文件。
有没有一种方法可以快速列出所有带有无效 HTML 的文件而忽略降价内容?可能使用 Windows 应用程序?
*应用程序
例如, Pandoc似乎通过了 markdown 输入中包含的无效 html。将 Pandoc 的 HTML 输出传递给HTML Tidy 进行验证。就像是:
$ pandoc input.md | tidy