18

我希望能够获取现有的 HTML 片段并将其转换为降价。为此,我尝试了 pandoc:

pandoc test.html -o test.md

test.html 看起来像这样:

Hello

<!-- more -->

and some more text

<h2>some heading</h2>       

结果是这样的:

Hello and some more text

some heading
------------

因此,它不仅会转换在降价中具有直接意义的标签。它还删除了我希望保留为 HTML 的标签(例如,HTML 注释、 iframe标签等)。

  • 如何将 HTML 转换为 markdown,以使任何在 markdown 中没有等效项的标签都保留为原始 HTML?
  • 更一般地说,我如何控制 HTML 到 markdown 的转换是如何完成的?

特别是,我会对命令行程序选项感兴趣。例如,也许有可以提供给 pandoc 的选项。

4

1 回答 1

20

经过一番搜索后,我在 table parsing--parse-raw的一个线程中阅读了有关该选项的信息。

添加该--parse-raw选项似乎不会去除非降价等效 HTML 标记。

pandoc test.html -o test.md --parse-raw
于 2013-04-27T06:25:04.333 回答