在 joksnet 程序的帮助下,我设法获得了我正在寻找的纯文本 Wikipedia 文章。
返回的文本包括标题的 Wiki 标记,例如,Albert Einstein 文章的部分返回如下:
==Biography==
===Early life and education===
blah blah blah
我真正想做的是将检索到的文本提供给一个函数,并将所有顶级部分包装在粗体 html 标记中,并将二级部分包装为斜体,如下所示:
<b>Biography</b>
<i>Early life and education</i>
blah blah blah
但恐怕我什至不知道如何开始,至少不会使功能变得幼稚。我需要使用正则表达式吗?任何建议都非常感谢。
PS对不起,如果“解析”对于我在这里尝试做的事情来说太强了。