有谁知道可以将 Wiki 格式的文本作为输入并生成实体树的解析器,就像 XML 解析器生成实体树一样?为了澄清,我正在寻找一些可以接受如下文字的东西:
-Intro-
Textual stuff in ''italics''
--Subhead--
Yet more text
并生成一棵以 Intro 为根的树,其中包含三个子节点,其中一个 (Subhead) 本身有一个子节点。我正在寻找可以理解http://meta.wikimedia.org/wiki/Help:Wikitext中描述的“简单”wiki 格式的东西。
我知道 Wiki 文本有几个词法分析器,但没有树解析器。我正在寻找开源并用 C 或 C++ 编写的东西。