维基百科的 HTML 标签有通用格式吗?即除了基础知识(头部、身体、身体等)之外,是否有特定的标签来分隔每个信息块?例如,介绍可能有标签<p>
,而第 1、2、3 节可能有标签<s1>, <s2>, <s3>
?
我需要能够按部分区分内容。另外,我没有使用 wikipedia api 来获取此信息,仅使用 Python。
作为 Wikipedia 的开关编辑器,编辑器不倾向于使用<p>
标签,更不用说许多 HTML 标签了。事实上,他们遵循自己的一套规则。
MediaWiki 几乎是 HTML 的替代品,但一些 HTML 标记确实有效(例如,<span>
用于着色文本的 s 等)。此外,部分不是在 HTML 中完成的。相比:
HTML:<h2>A header</h2>
媒体维基:==A header==
如果您想从每个标头中获取内容,那么一定要使用他们的 API。这是一个关于通过 API 编辑页面的链接:http ://www.mediawiki.org/wiki/API:Edit 。