2

我需要将 HTML 文档(从DocBook XML 文档生成)转换为 Wiki 标记语言,尤其是PM Wiki标记语言。目标是将公司的应用程序操作指南包含在我们新创建的 wiki 中。这意味着我实际上有两个选择:

  1. 将 HTML(从 DocBook XML 生成)转换为 wiki
  2. 将 Docbook XML 直接转换为 wiki

由于 HTML 是由 DocBook 到 HTML 转换器生成的,因此在 HTML 文档中定义标签的方式变化不大,只有文档的内容不同。

我正在寻找可以自己快速实施的解决方案。每次创建新版本的应用程序操作指南时,我都必须进行一次此转换。

到目前为止我想到的解决方案:

  1. 基于正则表达式,使用 Perl 或 PHP 脚本将 HTML 转换为 wiki。
  2. 将 Docbook XML 直接转换为 wiki。由于它是 XML,我可以使用 Java 进行 XML 解析。这里的风险是我不熟悉 DocBooks XML 格式(就像我对 HTML 一样),所以这需要一些时间来学习。

你会为这项工作选择什么方法?

更新:

我刚刚尝试了一个名为ConvertHTML的 PMWiki 扩展。它不能很好地工作,因为它不转换 HTML 标记(例如,没有像 wiki 中那样转换),正如它的文档所说:

PmWiki 标记不支持所有 HTML 标记,因此不可能进行 100% 转换。但是,PmWiki 可以在编辑或保存文本时对其进行替换。ConvertHTML 实现了一套相对全面的规则,用于将 HTML 标记转换为 wiki 标记。

4

3 回答 3

5

DocBook 到 Wiki可能有用,尽管它从 DocBook 转换到 MediaWiki,而不是 PM Wiki。

有一些 Perl 模块可以将 HTML 转换为各种 Wiki 方言:HTML::WikiConverter。因此,如果您可以将您的 DocBook 转换为 HTML,那么这也可能有效。

于 2009-10-29T10:50:16.060 回答
1

我使用Digester从一个简单的 XML 文件中生成 Java 对象,并通过 Java 根据我的需要对其进行修改。这是一个非常简单易用的工具。也许你想试一试。为我工作..

于 2009-10-29T10:45:37.793 回答
0

试试HTML2Mediawiki

(2020 年 3 月 10 日更新链接)

于 2012-03-19T20:23:51.033 回答