问题标签 [wikidata]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
wikipedia - 如何将 Freebase 查询转换为 Wikidata 查询?
以这个 Freebase 查询为例,我如何使用 Wikidata api 运行相同的查询?
谢谢你。
python - 如何使用 MediaWiki API 从(德语)维基百科中提取信息框?
我想从特定的 Wikipedia 页面(主要是国家/地区)中提取 Infobox 中的信息。具体来说,如果可能的话,我想在不使用Python
+BeautifulSoup4
或任何其他语言 + 库的情况下实现这一点。我宁愿使用官方 API,因为我注意到不同 Wikipedia 子域的 CSS 标签是不同的(与其他语言一样)。
在如何从 Mediawiki API 的维基百科文章中获取信息框?声明使用以下方法会起作用,对于给定的标题Scary Monsters and Nice Sprites
(
但是,我想Wikimedia
更改了他们的infobox
模板,因为当我运行上述查询时,我得到的只是内容,而不是infobox
. 例如Europäische_Union
,在以下代码段中对 (European_Union) 结果(以及其他)运行查询
不过,它适用于英文版的 Wikipedia。
所以我想从中提取信息框的页面是:http://de.wikipedia.org/wiki/Europäische_Union
这是我正在使用的代码:
我错过了一些非常重要的东西吗?
c++ - 如何有效地解析 C++ 中的大数据 json 文件(wikidata)?
我有一个大约 36 GB 的 json 文件(来自 wikidata),我想更有效地访问它。目前我在 C++ 中使用 rapidjsons SAX 风格的 API - 但解析整个文件在我的机器上需要大约 7415200 毫秒(=120 分钟)。我想根据 json 对象内的两个主键之一(“名称”或“实体键”-> 即“堆栈溢出”或“Q549037”)访问此文件中的 json 对象。这意味着我必须在最坏的情况下解析当前的整个文件。
所以我想到了两种方法:
- 将大文件拆分为数十亿个小文件 - 文件名指示名称/实体键(即 Q549037.json / Stack_Overflow.json 或 Q549037#Stack_Overflow.json) -> 不确定存储中的过载
ftell()
从主键到文件中的位置建立某种索引。建立索引大约需要 120 分钟(就像现在解析一样),但访问应该更快- 即使用类似两个的东西
std::unorderedmap
(可能会再次遇到内存问题) - 索引文件 - 创建两个文件:一个具有按名称排序的条目,另一个按实体键排序(创建这些文件可能需要更长的时间,因为排序)
- 即使用类似两个的东西
像这样的问题的最佳实践是什么?我应该遵循哪种方法?还有其他想法吗?
nlp - 从 Freebase 中转储关系的方法?
我已经浏览了 Freebase 的 Google API,但仍然令人困惑。有没有简单的方法可以从 Freebase 中转储关系?
我想转储所有具有特定关系的实体名称对(例如,marry_with,...),并且还想要中文实体名称。
我是不是该
- 编写 MQL 来查询所有满足条件的实体?(但 MQL 服务最近要退役了。)
- 或转储所有自由碱基并解析?
- 还是有其他 API 能够做到这一点?
- 或其他知识库(YAGO、DBpedia、wikidata)更容易做到这一点?
哪种方式更容易解决。请给我一些方向。谢谢
wikidata - 获取 Wikidata 属性的描述?
我们如何使用 pywikibot获得 Wikidata 属性(例如: P31 )的人类可读的属性描述?
wikidata - 省略来自 wbsearchentities 的消歧结果
我正在寻找对 wikidata 中的实体进行模糊文本搜索,并希望防止服务器返回“消歧”结果。
是否有更适合此的未记录参数或端点?
web-services - 使用一致的 URL 结构查询网页中的变量实体
有人可以帮助我了解如何在我的程序中注入对该网页的查询吗?
有两个参数需要设置,即
“站点:”是您输入语言和站点代码的地方。
&
“页面:”,您必须输入所连接站点上显示的页面的确切标题。
URL 总是如下所示:
语言总是英语,所以你看,它只是:
https://www.wikidata.org/wiki/Special:ItemByTitle?site=en&page=
呸呸呸+
_&submit=Search
查询该页面的目的是检索与该页面关联的 ID 值,因此 for Mikhail Bakunin
it'sQ27645
和 for T. E. Lawrence
it'sQ170596
一旦到达页面,它就会成为 URL 的一部分:
但也许我可以从页面中删除它,使用 beautifulSoup 或 soemthng?(这是一个猜测)
程序需要泛化,也就是说,我们要搜索的实体名称是可变的,在程序中会发生变化,所以需要考虑到这一点。
我想使用 python 或 php 或其他东西如果更容易的话不会是反人类罪,尽管我更喜欢 java。
更新:
这有点工作,但结果很混乱。
我想我可以从这件事中抓住它:
但如何?
mediawiki-api - 获取作为给定项目实例的所有 Wikidata 项目
Wikidata 有一个项目叫做智能手机模型。
我想获得它的所有实例。
问题:如何使用实时服务器以编程方式获取实例的标识符?
最好不包括出现在 WhatLinksHere 中但位于“Wikidata:”命名空间而不是主命名空间中的误报。
sparql - Wikidata - 这个查询可能吗?
我想在WikiData上查询所有项目,这些项目以某种方式连接到另一个项目。
例如,我有项目“维也纳”(Q1741)。现在我想获取所有在任何属性中都有维也纳项目的项目。
我目前使用的 API 来自wmflabs。在这里我可以做一个查询
这为我提供了具有“发现地点”(P189)=“维也纳”(Q1741)属性的每个项目。
但我想要的是
获取任何属性适合“维也纳”的所有项目,例如“出生地”(P19)、“死亡地”(P20)或其他任何东西。但是通配符在这里不起作用。
这可能吗?如何?
PS:我不受这个 API 的约束,我可以使用任何 API 来访问通过 JS 访问的 wikidata。还有一些可用的 Wikidata-Dump 的 SparQL 端点(如 wikidataldf),但我不知道它们有多稳定。但是,如果有人可以使用SPARQL提供解决方案,我也会很高兴。