-1

维基百科的 HTML 标签有通用格式吗?即除了基础知识(头部、身体、身体等)之外,是否有特定的标签来分隔每个信息块?例如,介绍可能有标签<p>,而第 1、2、3 节可能有标签<s1>, <s2>, <s3>

我需要能够按部分区分内容。另外,我没有使用 wikipedia api 来获取此信息,仅使用 Python。

4

1 回答 1

3

作为 Wikipedia 的开关编辑器,编辑器不倾向于使用<p>标签,更不用说许多 HTML 标签了。事实上,他们遵循自己的一套规则

MediaWiki 几乎是 HTML 的替代品,但一些 HTML 标记确实有效(例如,<span>用于着色文本的 s 等)。此外,部分不是在 HTML 中完成的。相比:

HTML:<h2>A header</h2>

媒体维基:==A header==

如果您想从每个标头中获取内容,那么一定要使用他们的 API。这是一个关于通过 API 编辑页面的链接:http ://www.mediawiki.org/wiki/API:Edit 。

于 2013-04-27T04:14:44.450 回答