我希望能够获取现有的 HTML 片段并将其转换为降价。为此,我尝试了 pandoc:
pandoc test.html -o test.md
test.html 看起来像这样:
Hello
<!-- more -->
and some more text
<h2>some heading</h2>
结果是这样的:
Hello and some more text
some heading
------------
因此,它不仅会转换在降价中具有直接意义的标签。它还删除了我希望保留为 HTML 的标签(例如,HTML 注释、 iframe
标签等)。
- 如何将 HTML 转换为 markdown,以使任何在 markdown 中没有等效项的标签都保留为原始 HTML?
- 更一般地说,我如何控制 HTML 到 markdown 的转换是如何完成的?
特别是,我会对命令行程序选项感兴趣。例如,也许有可以提供给 pandoc 的选项。