“wikidata”的相关标签问题_Stack Overflow中文网

0 投票

2 回答

593 浏览

wikipedia - 如何将 Freebase 查询转换为 Wikidata 查询？

以这个 Freebase 查询为例，我如何使用 Wikidata api 运行相同的查询？

谢谢你。

2015-01-31T17:16:39.860

0 投票

1 回答

835 浏览

python - 如何使用 MediaWiki API 从（德语）维基百科中提取信息框？

我想从特定的 Wikipedia 页面（主要是国家/地区）中提取 Infobox 中的信息。具体来说，如果可能的话，我想在不使用Python+BeautifulSoup4或任何其他语言 + 库的情况下实现这一点。我宁愿使用官方 API，因为我注意到不同 Wikipedia 子域的 CSS 标签是不同的（与其他语言一样）。

在如何从 Mediawiki API 的维基百科文章中获取信息框？声明使用以下方法会起作用，对于给定的标题Scary Monsters and Nice Sprites（

但是，我想Wikimedia更改了他们的infobox模板，因为当我运行上述查询时，我得到的只是内容，而不是infobox. 例如Europäische_Union，在以下代码段中对 (European_Union) 结果（以及其他）运行查询

不过，它适用于英文版的 Wikipedia。

所以我想从中提取信息框的页面是：http://de.wikipedia.org/wiki/Europäische_Union

这是我正在使用的代码：

我错过了一些非常重要的东西吗？

python web-scraping wikipedia-api mediawiki-api wikidata

2015-02-05T21:13:07.277

0 投票

4 回答

1692 浏览

c++ - 如何有效地解析 C++ 中的大数据 json 文件（wikidata）？

我有一个大约 36 GB 的 json 文件（来自 wikidata），我想更有效地访问它。目前我在 C++ 中使用 rapidjsons SAX 风格的 API - 但解析整个文件在我的机器上需要大约 7415200 毫秒（=120 分钟）。我想根据 json 对象内的两个主键之一（“名称”或“实体键”-> 即“堆栈溢出”或“Q549037”）访问此文件中的 json 对象。这意味着我必须在最坏的情况下解析当前的整个文件。

所以我想到了两种方法：

将大文件拆分为数十亿个小文件 - 文件名指示名称/实体键（即 Q549037.json / Stack_Overflow.json 或 Q549037#Stack_Overflow.json） -> 不确定存储中的过载
ftell()从主键到文件中的位置建立某种索引。建立索引大约需要 120 分钟（就像现在解析一样），但访问应该更快
- 即使用类似两个的东西std::unorderedmap（可能会再次遇到内存问题）
- 索引文件 - 创建两个文件：一个具有按名称排序的条目，另一个按实体键排序（创建这些文件可能需要更长的时间，因为排序）

像这样的问题的最佳实践是什么？我应该遵循哪种方法？还有其他想法吗？

c++json bigdata rapidjson wikidata

2015-02-08T06:57:50.840

0 投票

1 回答

746 浏览

nlp - 从 Freebase 中转储关系的方法？

我已经浏览了 Freebase 的 Google API，但仍然令人困惑。有没有简单的方法可以从 Freebase 中转储关系？

我想转储所有具有特定关系的实体名称对（例如，marry_with，...），并且还想要中文实体名称。

我是不是该

编写 MQL 来查询所有满足条件的实体？（但 MQL 服务最近要退役了。）
或转储所有自由碱基并解析？
还是有其他 API 能够做到这一点？
或其他知识库（YAGO、DBpedia、wikidata）更容易做到这一点？

哪种方式更容易解决。请给我一些方向。谢谢

nlp semantic-web freebase dbpedia wikidata

2015-03-14T08:05:47.167

0 投票

1 回答

1201 浏览

wikidata - 获取 Wikidata 属性的描述？

我们如何使用 pywikibot获得 Wikidata 属性（例如： P31 ）的人类可读的属性描述？

wikidata wikidata-api pywikibot

2015-03-21T05:24:19.120

0 投票

1 回答

268 浏览

wikidata - 省略来自 wbsearchentities 的消歧结果

我正在寻找对 wikidata 中的实体进行模糊文本搜索，并希望防止服务器返回“消歧”结果。

http://www.wikidata.org/w/api.php?action=wbsearchentities&search=abc&language=en&limit=3&format=jsonfm

是否有更适合此的未记录参数或端点？

wikidata wikidata-api

2015-03-21T19:58:43.503

0 投票

1 回答

113 浏览

web-services - 使用一致的 URL 结构查询网页中的变量实体

有人可以帮助我了解如何在我的程序中注入对该网页的查询吗？

有两个参数需要设置，即

“站点：”是您输入语言和站点代码的地方。

&

“页面：”，您必须输入所连接站点上显示的页面的确切标题。

URL 总是如下所示：

语言总是英语，所以你看，它只是：

https://www.wikidata.org/wiki/Special:ItemByTitle?site=en&page=呸呸呸+_&submit=Search

查询该页面的目的是检索与该页面关联的 ID 值，因此 for Mikhail Bakuninit'sQ27645和 for T. E. Lawrenceit'sQ170596

一旦到达页面，它就会成为 URL 的一部分：

但也许我可以从页面中删除它，使用 beautifulSoup 或 soemthng？（这是一个猜测）

程序需要泛化，也就是说，我们要搜索的实体名称是可变的，在程序中会发生变化，所以需要考虑到这一点。

我想使用 python 或 php 或其他东西如果更容易的话不会是反人类罪，尽管我更喜欢 java。

更新：

这有点工作，但结果很混乱。

我想我可以从这件事中抓住它：

但如何？

web-services wikidata

2015-04-17T10:41:38.643

0 投票

3 回答

3572 浏览

mediawiki-api - 获取作为给定项目实例的所有 Wikidata 项目

Wikidata 有一个项目叫做智能手机模型。
我想获得它的所有实例。

问题：如何使用实时服务器以编程方式获取实例的标识符？

最好不包括出现在 WhatLinksHere 中但位于“Wikidata：”命名空间而不是主命名空间中的误报。

mediawiki-api wikidata wikidata-api

2015-04-27T02:48:30.690

0 投票

4 回答

662 浏览

sparql - Wikidata - 这个查询可能吗？

我想在WikiData上查询所有项目，这些项目以某种方式连接到另一个项目。

例如，我有项目“维也纳”（Q1741）。现在我想获取所有在任何属性中都有维也纳项目的项目。

我目前使用的 API 来自wmflabs。在这里我可以做一个查询

这为我提供了具有“发现地点”（P189）=“维也纳”（Q1741）属性的每个项目。

但我想要的是

获取任何属性适合“维也纳”的所有项目，例如“出生地”（P19）、“死亡地”（P20）或其他任何东西。但是通配符在这里不起作用。

这可能吗？如何？

PS：我不受这个 API 的约束，我可以使用任何 API 来访问通过 JS 访问的 wikidata。还有一些可用的 Wikidata-Dump 的 SparQL 端点（如 wikidataldf），但我不知道它们有多稳定。但是，如果有人可以使用SPARQL提供解决方案，我也会很高兴。

sparql rdf semantic-web wikidata wikidata-api

2015-05-01T10:40:20.953

0 投票

1 回答

308 浏览

mediawiki - 如何在 wikicode 中获取 Wikidata 项目的名称？

假设我有一个 Wikidata 项目 QID ，并且想在不相关的Mediawiki页面Q19675的 wikicode 中获取该项目的西班牙语名称。

虽然获得类似的属性P281 postal code很容易（只需编写{{#property:P281|from=Q19675}}），但如何获得名称，由于某种原因不是正常的属性？

维基数据项目名称

与这个问题不同，这次我不是在寻找 REST API，而是在寻找 Mediawiki wikicode 表达式。

mediawiki wikidata

2015-05-20T04:57:58.357

问题标签 [wikidata]

Reference