我有一个数据库,我需要跟上 Wikidata 的变化,在寻找方法时,我发现了这三个:
- RSS
- API 调用
- 套接字.IO
我想知道是否有其他方法,哪一种是最好的或维基数据推荐的
我有一个数据库,我需要跟上 Wikidata 的变化,在寻找方法时,我发现了这三个:
我想知道是否有其他方法,哪一种是最好的或维基数据推荐的
答案取决于您需要保持数据库的最新程度。
尽可能保持最新
如果您需要尽可能使您的数据库与 Wikidata 保持同步,那么您可能希望使用您找到的解决方案的组合。
Socket.IO 将为您提供已更改的流,但不一定会为您提供所需的所有信息。(注意:有一个 IRC 流可以让你做同样的事情)
根据流提供的数据,您可以调用 Wikidata API 来检索新数据。
当然,这可能会导致大量 API 调用,因此请确保对它们进行批处理,并且不要立即检索更新,以防连续发生大量更改。
每日或每周
除了上面列出的 3 个选项外,您还拥有数据库转储! https://www.wikidata.org/wiki/Wikidata:Database_download
通常建议使用 JSON 和 RDF 转储。JSON 转储包含与存储完全相同的数据。这些转储每周进行一次。
XML 转储不保证与 JSON 转储具有相同的 JSON 格式,因为它们使用内部序列化格式。但是,提供了每日 XML 转储。