mwlib - MediaWiki 解析器和实用程序库
pediapress/mwlib:
mwlib 提供了一个用于解析 MediaWiki 文章并将它们转换为不同输出格式的库。维基百科的“打印/导出”功能使用 mwlib 从维基百科文章中生成 PDF 文档。
这是文档页面。使用的旧文档页面有一个单行示例:
from mwlib.uparser import simpleparse
simpleparse("=h1=\n*item 1\n*item2\n==h2==\nsome [[Link|caption]] there\n")
如果您想了解它是如何在实际中使用的,请查看代码附带的测试用例。(来自 git 存储库的 mwlib/tests/test_parser.py):
from mwlib import parser, expander, uparser
from mwlib.expander import DictDB
from mwlib.xfail import xfail
from mwlib.dummydb import DummyDB
from mwlib.refine import util, core
parse = uparser.simpleparse
def test_headings():
r=parse(u"""
= 1 =
== 2 ==
= 3 =
""")
sections = [x.children[0].asText().strip() for x in r.children if isinstance(x, parser.Section)]
assert sections == [u"1", u"3"]
另请参阅标记规范和替代解析器以获取更多信息。