问题标签 [dbpedia]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
sparql - 如何正确使用 SPARQL OPTIONAL 来检索可能存在的资源的属性?
我正在尝试使用 SPARQL 查询来检索有关 DBpedia 资源(人)的信息。我想使用相同的查询通过参数化资源 URI 来检索有关任何 Person 的数据。由于特定资源可能不存在某些属性,因此我正在使用该OPTIONAL
语句。这是我的查询:
除了 label、abstract 和 page in 之外,我已经保留了所有内容OPTIONAL
,因为如果我对另一个人使用相同的查询,他们可能没有这些属性。问题是,这些可选属性都没有出现在结果中。birthDate
在 Neil Simon 的案例中,您可以看到birthPlace
和的值:http thumbnail
: //dbpedia.org/resource/Neil_Simon。但是,当我运行查询时,这些值不会显示:DBpedia SPARQL query。我做错了什么,我怎样才能有选择地检索这些属性?
java - Dbpedia 提取框架 - 如何剥离 mediawiki 格式标记
我正在玩 dbpedia 提取框架。看起来很不错,我很高兴构建维基百科页面的 AST 并提取链接(使用 WikiParser)。然而,虽然我从解析中得到了一个很好的结构化树,但我注意到文本节点仍然包含许多格式标记(例如,用于斜体、粗体等的撇号)。出于我的目的,这些没有帮助 - 我只想要纯文本。
我可以花一些时间编写自己的代码来删除它,但我假设这样的东西对 dbpedia 很有用 - 并且它存在于库中的某个地方。我对吗?如果是这样 - 剥离到裸文本的额外功能在哪里?
否则 - 有没有人知道任何其他(最好是 scala)包来去除 mediawiki 标记?
编辑
应要求提供更多详细信息。以下标记:
来自 dbpedia 作为 TextNode 的内容,但未触及。我希望能够将其剥离为:
或者可能是一个更结构化的 AST,其附加节点表示原始文本的每个部分,可能(在每个节点上)用要应用的格式类型(例如斜体、粗体等)进行注释。
事实上,dbpedia 解析的最终结果仍然充满了标记。
希望有帮助。
sparql - DBpedia 和 SPARQL:带重音符号的查询不起作用
所以我尝试了很多不同的事情并一直在寻找解决方案,但没有任何运气......
我的 SPARQL 查询是
当 $term 等于名称中带有重音符号的东西时,它会全部搞砸并且没有给出结果。我尝试了很多不同的东西,但似乎无法让它们中的任何一个起作用。希望得到一些帮助。
谢谢
编辑
我正在使用 PHP 和 curl。这是我根据需要下载和修改的东西……这是它与 dbpedia 通信的部分。
$query 贴在上面,使用的格式是 json。
编辑 2
这是我正在使用的源代码。https://gist.github.com/380379也许查看完整代码会让您更好地了解问题所在。
我将包含带重音的姓氏的数据库字段更改为“utf8_unicode_ci”,但我仍然卡住了,找不到任何可行的解决方案。
sparql - 有句点的 DBpedia SPARQL 查询
我正在尝试获取曼联足球队的摘要,问题是 wiki 链接中有句点。当我尝试这个时,
由于FC后的时间段而返回错误
有想法该怎么解决这个吗?
rdf - 获取 DBPedia Infobox 类别
我目前正在寻找一种通过 SPARQL 端点查询DBPedia 的 Infobox Onyology 数据库的方法,以获取类列表、所选类的子类以及给定类的属性。据我所知,您要么需要知道您正在寻找的属性,要么搜索特定的东西——我发现的所有示例似乎都基于您想要搜索特定的东西的想法(例如高于一定海拔的城市人口等),而我想构建一些可以有效“浏览”类别的东西。例如,从这个类层次图上“owl:Thing”的子类列表开始并向用户呈现所选子类的子类列表。似乎可以通过映射 wiki 浏览类似的内容,但最好直接查询 SPARQL 端点。
是否有一些简单的 SPARQL 查询可以返回这些类的可用类和属性?
更新: 我想出了一种方法来获取它看起来的类层次结构,通过迭代这个查询:
它返回 owl:Thing 的子类列表,如果我用其中一个子类替换 owl:Thing,我会得到该子类的子类列表,直到没有子类,此时我可以选择所有具有由所选子类给出的类型。不过,我仍然不太确定如何获取子类共有的所有属性。
更新 2 现在越来越近了。这个查询让我得到所有的属性(dbpedia:property 的子级)也是一个国家,以及它们的标题:
这实际上是我真正要求的。我现在要做的最后一件事是尝试按它们出现的页数对它们进行排序(大概最常见的属性将是最感兴趣的属性)。
frameworks - 设置自己的 DBpedia 服务器以创建新的映射
我想扩展 DBpedia 的映射数据库。因此,我想在我的计算机上运行我自己的提取框架实例。尽管后者只是简单地完成了,但我无法弄清楚如何为框架提供新创建的映射。
到目前为止我发现了什么:
- 在“config.properties”中,我可以定义自己的转储文件夹。
- 也可以定义一些输出目录。但是那里究竟存储了什么?
- 在“Configuration.scala”中定义了映射页面的 url。这是否意味着框架需要一个网页作为输入,然后搜索映射?
我的目标是在纯文本文件中定义一些映射,然后以某种方式告诉提取框架将此文件用作所有映射的源。如果一切顺利,我将把我的成果贡献给 dbpedia 团队。
谢谢你的帮助!
sparql - 来自 DBpedia 和 Jena 的 SPARQL XML 结果
我从 DBpedia SPARQL 端点获得以下 XML:
当我和 Jena 一起阅读它并尝试扫描它时:
我总是得到以下异常:
这是耶拿虫还是别的什么?
编辑:为了完整起见,我报告了一个关于这个错误的线程:
当来自 bio2rdf 邮件列表的一些帮助时,我们能够更多地追踪错误。
Arq 2.8.3 工作正常 Arq 2.8.4 失败并出现描述的错误 Arq 2.8.5 失败并出现描述的错误 所以我想我会保留 Art 2.8.3 进行测试。让我知道是否可以帮助更多地调试此错误。
诡异的。错误来自 STaX 解析器 - 所有基本级别的 XML 解析都分包给 Woodstox。几乎是它的读取速度快于输入到达并看到 EOF 而不是阻塞新输入。我尝试读取整个流,然后解析读取的字节,它工作正常。为什么 2.8.3 应该有所不同,目前我不清楚这可能只是时机。
解决方法:使用以下命令切换 XML 解析器:
ARQ.getContext().setTrue(ARQ.useSAX) ;
在调用 QueryExecutionFactory.sparqlService 之前
random - 如何从 SPARQL 中选择随机 DBPedia 节点?
如何使用 sparql 端点从 DBpedia 中选择随机样本?
这个查询
(在此处找到)似乎在大多数 SPARQL 端点上都可以正常工作,但在http://dbpedia.org/sparql上它会被缓存(因此它总是返回相同的 10 个节点)。
如果我从 JENA 尝试,我会收到以下异常:
而且我找不到'bif'命名空间是什么。
关于如何解决这个问题的任何想法?
穆龙
java - 如何通过使用 jena 提供属性名称来获取 dbpedia 中属性的命名空间?
我正在尝试使用 jena http://dbpedia.org/page/Black_Sabbath中的 sparql 在以下 dbpedia 链接中获取属性类型的值
但我不知道如何从 dbpedia 获取属性名称空间(在我的示例中为dbpedia-owl .genre),我不想对其进行硬编码。任何人都可以帮助我lz...
非常感谢