问题标签 [wikidata]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
scala - 从文本中高效提取 WikiData 实体
我有很多文本(数百万),从 100 到 4000 字不等。这些文本被格式化为书面作品,带有标点符号和语法。一切都是英文的。
问题很简单:如何从给定文本中提取每个 WikiData 实体?
实体被定义为每个名词,专有名词或常规名词。即人名、组织名、地点名和椅子、土豆等事物的名称。
到目前为止,我已经尝试了以下方法:
- 使用OpenNLP对文本进行标记,并使用预先训练的模型来提取人员、位置、组织和常规名词。
- 在适用的情况下应用Porter Stemming。
- 将所有提取的名词与wmflabs-API匹配以检索潜在的 WikiData ID。
这行得通,但我觉得我可以做得更好。一个明显的改进是在本地缓存 WikiData 的相关部分,我打算这样做。但是,在我这样做之前,我想检查是否有其他解决方案。
建议?
我标记了问题 Scala,因为我正在使用Spark来完成这项任务。
openlayers - OpenLayers LonLat 变换
我正在尝试将 OSM OpenLayers 示例与我从query.wikidata.org获得的结果结合起来,但似乎我做错了转换。long 和 lat 的正确转换是什么?
c# - 如何遍历 Wikidata JSON 对象?
我正在尝试遍历一个 Wikidata JSON 对象并且在某种程度上是成功的。我正在解析以下内容: http: //www.wikidata.org/wiki/Special :EntityData/Q319.json
我正在使用如下代码进行迭代:
这一直有效,直到我得到如下的“索赔”。
我在 claim.Value 中使用以下 JSON 文本,但是 field_name 为空。
如何动态迭代上述对象中的值?如果可能,我宁愿迭代而不是尝试建立对象结构并反序列化。
python - 从 Wikidata API 在 python 中获取 itemlabel
我正在尝试使用 Wikidata API 创建一个包含所有哈利波特角色名称的列表。我想从下面的链接中获取项目标签(字符名称)到我的 Python 笔记本中。
这是我想要运行的 Wikidata 查询服务查询。
运行上面的最后一行代码后,我不断收到此错误:
结果仍然以 XML 而不是 JSON 返回,即使我在查询末尾指定了 JSON。任何有关如何解决此问题的想法将不胜感激。
sparql - 查询WikiData,p和wdt默认前缀的区别
我是 wikidata 的新手,我不知道什么时候应该使用 -->
wdt前缀 ( http://www.wikidata.org/prop/direct/ )
什么时候应该使用 -->
p前缀(http://www.wikidata.org/prop/)。
在我的 sparql 查询中。有人可以解释这些中的每一个是什么意思,有什么区别?
sparql - 在 Wikidata-SPARQL 中使用限定符
我是 SPARQL/Wikidata 的新手,并试图弄清楚我是如何询问安吉丽娜朱莉开始与她的每个配偶约会的时间。
我在 Jolie 的 Wikidata 条目中看到了信息,但我无法形成有效的查询来获取它。我想这与我不完全理解的那些“限定词”有关。
这是我已经尝试过的:
我知道这是错误的..我只是不知道如何解决它..我想表达了解特定先前谓词属性的愿望
谢谢您的帮助!
ps:我的问题的答案应该是:Jonny Lee Miller 1995 Billy Bob Thornton March 2000 Brad Pitt 23 August 2014
python - 通过 Pywikibot 检查 Wikidata 上是否已存在具有特定标签和描述的项目
我正在寻找一种方法来找出具有特定标签和描述的项目是否已经存在于 Wikidata 上。此任务应由 Pywikibot 执行。如果它已经存在,我不希望我的 Bot 创建一个新项目。到目前为止,我的代码如下所示:
javascript - 无法访问维基数据 API
我正在尝试使用 Wikidata API,但我得到的只是:
Fetch API 无法加载https://www.wikidata.org/w/api.php?action=wbsearchentities&search=Ingmar%20Bergman&language=en&limit=20&format=json&origin=http%3A%2F%2Fwww.dev.example.com%3A3000。对预检请求的响应未通过访问控制检查:请求的资源上不存在“Access-Control-Allow-Origin”标头。因此,不允许访问来源“ http://www.dev.example.com:3000 ”。如果不透明的响应满足您的需求,请将请求的模式设置为“no-cors”以获取禁用 CORS 的资源。
这是代码:
我也试过JSONP,没有成功。在浏览器中运行链接(只是没有 origin 参数)会给出正确的响应。
java - 使用 Jena 查询 wikidata
目前,Wikidata 有一个 SPARQL 端点“ https://query.wikidata.org/ ”,我想使用 Jena (3.0.1) 查询该站点,我使用以下代码但收到错误消息“端点返回内容-类型:文本/html,当前不支持 SELECT 查询“。有没有办法解决它?相同的代码适用于 dbpedia。谢谢
json - 如何可靠地获取维基百科信息框中使用的图像?
我如何(可靠地)从 API 获取 Wikipedia Infobox 中使用的主图像?
之前已经提出过这个问题,并且接受的答案承认这只是一个猜测。随后的答案似乎是一个黑客,充其量是不返回正确的图像。
例如,Jimi Hendrix Wikipedia 条目"File:Jimi Hendrix 1967.png"
用作 InfoBox 中的主图像。
更新后的答案建议使用此网址,但对于 Jimi Hendrix(和其他主题),它经常返回错误的图像。
如果我拉入所有图像,则无法确定信息框中使用的是哪个图像。