问题标签 [wikidata]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
593 浏览

wikipedia - 如何将 Freebase 查询转换为 Wikidata 查询?

以这个 Freebase 查询为例,我如何使用 Wikidata api 运行相同的查询?

谢谢你。

0 投票
1 回答
835 浏览

python - 如何使用 MediaWiki API 从(德语)维基百科中提取信息框?

我想从特定的 Wikipedia 页面(主要是国家/地区)中提取 Infobox 中的信息。具体来说,如果可能的话,我想在不使用Python+BeautifulSoup4或任何其他语言 + 库的情况下实现这一点。我宁愿使用官方 API,因为我注意到不同 Wikipedia 子域的 CSS 标签是不同的(与其他语言一样)。

如何从 Mediawiki API 的维基百科文章中获取信息框?声明使用以下方法会起作用,对于给定的标题Scary Monsters and Nice Sprites

但是,我想Wikimedia更改了他们的infobox模板,因为当我运行上述查询时,我得到的只是内容,而不是infobox. 例如Europäische_Union,在以下代码段中对 (European_Union) 结果(以及其他)运行查询

不过,它适用于英文版的 Wikipedia。

所以我想从中提取信息框的页面是:http://de.wikipedia.org/wiki/Europäische_Union

这是我正在使用的代码:

我错过了一些非常重要的东西吗?

0 投票
4 回答
1692 浏览

c++ - 如何有效地解析 C++ 中的大数据 json 文件(wikidata)?

我有一个大约 36 GB 的 json 文件(来自 wikidata),我想更有效地访问它。目前我在 C++ 中使用 rapidjsons SAX 风格的 API - 但解析整个文件在我的机器上需要大约 7415200 毫秒(=120 分钟)。我想根据 json 对象内的两个主键之一(“名称”或“实体键”-> 即“堆栈溢出”或“Q549037”)访问此文件中的 json 对象。这意味着我必须在最坏的情况下解析当前的整个文件。

所以我想到了两种方法:

  • 将大文件拆分为数十亿个小文件 - 文件名指示名称/实体键(即 Q549037.json / Stack_Overflow.json 或 Q549037#Stack_Overflow.json) -> 不确定存储中的过载
  • ftell()从主键到文件中的位置建立某种索引。建立索引大约需要 120 分钟(就像现在解析一样),但访问应该更快
    • 即使用类似两个的东西std::unorderedmap(可能会再次遇到内存问题)
    • 索引文件 - 创建两个文件:一个具有按名称排序的条目,另一个按实体键排序(创建这些文件可能需要更长的时间,因为排序)

像这样的问题的最佳实践是什么?我应该遵循哪种方法?还有其他想法吗?

0 投票
1 回答
746 浏览

nlp - 从 Freebase 中转储关系的方法?

我已经浏览了 Freebase 的 Google API,但仍然令人困惑。有没有简单的方法可以从 Freebase 中转储关系?

我想转储所有具有特定关系的实体名称对(例如,marry_with,...),并且还想要中文实体名称。

我是不是该

  • 编写 MQL 来查询所有满足条件的实体?(但 MQL 服务最近要退役了。)
  • 或转储所有自由碱基并解析?
  • 还是有其他 API 能够做到这一点?
  • 或其他知识库(YAGO、DBpedia、wikidata)更容易做到这一点?

哪种方式更容易解决。请给我一些方向。谢谢

0 投票
1 回答
1201 浏览

wikidata - 获取 Wikidata 属性的描述?

我们如何使用 pywikibot获得 Wikidata 属性(例如: P31 )的人类可读的属性描述?

0 投票
1 回答
268 浏览

wikidata - 省略来自 wbsearchentities 的消歧结果

我正在寻找对 wikidata 中的实体进行模糊文本搜索,并希望防止服务器返回“消歧”结果。

http://www.wikidata.org/w/api.php?action=wbsearchentities&search=abc&language=en&limit=3&format=jsonfm

是否有更适合此的未记录参数或端点?

0 投票
1 回答
113 浏览

web-services - 使用一致的 URL 结构查询网页中的变量实体

有人可以帮助我了解如何在我的程序中注入对该网页的查询吗?

有两个参数需要设置,即

“站点:”是您输入语言和站点代码的地方。

&

“页面:”,您必须输入所连接站点上显示的页面的确切标题。

URL 总是如下所示:

语言总是英语,所以你看,它只是:

https://www.wikidata.org/wiki/Special:ItemByTitle?site=en&page=呸呸呸+_&submit=Search

查询该页面的目的是检索与该页面关联的 ID 值,因此 for Mikhail Bakuninit'sQ27645和 for T. E. Lawrenceit'sQ170596

一旦到达页面,它就会成为 URL 的一部分:

但也许我可以从页面中删除它,使用 beautifulSoup 或 soemthng?(这是一个猜测)

程序需要泛化,也就是说,我们要搜索的实体名称是可变的,在程序中会发生变化,所以需要考虑到这一点。

我想使用 python 或 php 或其他东西如果更容易的话不会是反人类罪,尽管我更喜欢 java。

更新:

这有点工作,但结果很混乱。

我想我可以从这件事中抓住它:

但如何?

0 投票
3 回答
3572 浏览

mediawiki-api - 获取作为给定项目实例的所有 Wikidata 项目

Wikidata 有一个项目叫做智能手机模型
我想获得它的所有实例。

问题:如何使用实时服务器以编程方式获取实例的标识符?

最好不包括出现在 WhatLinksHere 中但位于“Wikidata:”命名空间而不是主命名空间中的误报。

0 投票
4 回答
662 浏览

sparql - Wikidata - 这个查询可能吗?

我想在WikiData上查询所有项目,这些项目以某种方式连接到另一个项目。

例如,我有项目“维也纳”(Q1741)。现在我想获取所有在任何属性中都有维也纳项目的项目。

我目前使用的 API 来自wmflabs。在这里我可以做一个查询

这为我提供了具有“发现地点”(P189)=“维也纳”(Q1741)属性的每个项目。

但我想要的是

获取任何属性适合“维也纳”的所有项目,例如“出生地”(P19)、“死亡地”(P20)或其他任何东西。但是通配符在这里不起作用。

这可能吗?如何?


PS:我不受这个 API 的约束,我可以使用任何 API 来访问通过 JS 访问的 wikidata。还有一些可用的 Wikidata-Dump 的 SparQL 端点(如 wikidataldf),但我不知道它们有多稳定。但是,如果有人可以使用SPARQL提供解决方案,我也会很高兴。

0 投票
1 回答
308 浏览

mediawiki - 如何在 wikicode 中获取 Wikidata 项目的名称?

假设我有一个 Wikidata 项目 QID ,并且想在不相关的Mediawiki页面Q19675的 wikicode 中获取该项目的西班牙语名称。

虽然获得类似的属性P281 postal code很容易(只需编写{{#property:P281|from=Q19675}}),但如何获得名称,由于某种原因不是正常的属性

维基数据项目名称

这个问题不同,这次我不是在寻找 REST API,而是在寻找 Mediawiki wikicode 表达式