2

我正在尝试制作类似于个人电视指南的东西,它将显示 HIMYM 和 TBBT 的最后一集的标题和播出日期。

作为这些信息的资源,我决定使用维基百科。我知道 Wikipedia 有它自己的 API,我已经浏览了很长一段时间的文档,但它真的很广泛,我不知道从哪里开始。到目前为止,我已经到了查询这个 URL 的地步:

http://en.wikipedia.org/w/api.php?action=query&title=List_of_How_I_Met_Your_Mother_episodes&prop=info&format=dbg

并接收以下数组:

array (
  'query' => 
  array (
    'pages' => 
    array (
      6048517 => 
      array (
        'pageid' => 6048517,
        'ns' => 0,
        'title' => 'List of How I Met Your Mother episodes',
        'touched' => '2011-01-25T15:33:45Z',
        'lastrevid' => 409077359,
        'counter' => 0,
        'length' => 4417,
      ),
    ),
  ),
)

问题是我不知道如何获得我正在寻找的实际数据:/也许有人对维基百科 API 有更多的经验,并且可以以某种方式帮助我解决这个问题。谢谢

4

1 回答 1

3

请注意,MediaWiki API 只允许访问 MediaWiki 类型的信息。wiki 是某种文本页面的集合。MediaWiki 软件在维基百科上存储信息的方式没有继承语义。一切都是通过特殊的、基于文本的格式来完成的。

因此,即使您在 Wikipedia 上找到有关某事的一般且一致的信息,也不是因为软件做到了,而是因为作者决定采用通用标准来显示数据。因此,要从 wiki 中获取实际语义,您需要自己解析信息。您可以使用 MediaWiki API 获取软件为文章存储的确切文本表示,并从文本中解析您正在寻找的信息。当然,这要求您知道特定信息通常在何处以及如何显示。当然,不能保证它会一直有效,或者对您测试的每个页面都有效。

于 2011-01-25T21:27:33.233 回答