问题标签 [dbpedia]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
10166 浏览

sparql - 如何正确使用 SPARQL OPTIONAL 来检索可能存在的资源的属性?

我正在尝试使用 SPARQL 查询来检索有关 DBpedia 资源(人)的信息。我想使用相同的查询通过参数化资源 URI 来检索有关任何 Person 的数据。由于特定资源可能不存在某些属性,因此我正在使用该OPTIONAL语句。这是我的查询:

除了 label、abstract 和 page in 之外,我已经保留了所有内容OPTIONAL,因为如果我对另一个人使用相同的查询,他们可能没有这些属性。问题是,这些可选属性都没有出现在结果中。birthDate在 Neil Simon 的案例中,您可以看到birthPlace和的值:http thumbnail: //dbpedia.org/resource/Neil_Simon。但是,当我运行查询时,这些值不会显示:DBpedia SPARQL query。我做错了什么,我怎样才能有选择地检索这些属性?

0 投票
3 回答
928 浏览

java - Dbpedia 提取框架 - 如何剥离 mediawiki 格式标记

我正在玩 dbpedia 提取框架。看起来很不错,我很高兴构建维基百科页面的 AST 并提取链接(使用 WikiParser)。然而,虽然我从解析中得到了一个很好的结构化树,但我注意到文本节点仍然包含许多格式标记(例如,用于斜体、粗体等的撇号)。出于我的目的,这些没有帮助 - 我只想要纯文本。

我可以花一些时间编写自己的代码来删除它,但我假设这样的东西对 dbpedia 很有用 - 并且它存在于库中的某个地方。我对吗?如果是这样 - 剥离到裸文本的额外功能在哪里?

否则 - 有没有人知道任何其他(最好是 scala)包来去除 mediawiki 标记?

编辑

应要求提供更多详细信息。以下标记:

来自 dbpedia 作为 TextNode 的内容,但未触及。我希望能够将其剥离为:

或者可能是一个更结构化的 AST,其附加节点表示原始文本的每个部分,可能(在每个节点上)用要应用的格式类型(例如斜体、粗体等)进行注释。

事实上,dbpedia 解析的最终结果仍然充满了标记。

希望有帮助。

0 投票
2 回答
1406 浏览

sparql - DBpedia 和 SPARQL:带重音符号的查询不起作用

所以我尝试了很多不同的事情并一直在寻找解决方案,但没有任何运气......

我的 SPARQL 查询是

当 $term 等于名称中带有重音符号的东西时,它会全部搞砸并且没有给出结果。我尝试了很多不同的东西,但似乎无法让它们中的任何一个起作用。希望得到一些帮助。

谢谢

编辑

我正在使用 PHP 和 curl。这是我根据需要下载和修改的东西……这是它与 dbpedia 通信的部分。

$query 贴在上面,使用的格式是 json。

编辑 2

这是我正在使用的源代码。https://gist.github.com/380379也许查看完整代码会让您更好地了解问题所在。

我将包含带重音的姓氏的数据库字段更改为“utf8_unicode_ci”,但我仍然卡住了,找不到任何可行的解决方案。

0 投票
1 回答
555 浏览

sparql - 有句点的 DBpedia SPARQL 查询

我正在尝试获取曼联足球队的摘要,问题是 wiki 链接中有句点。当我尝试这个时,

由于FC后的时间段而返回错误

有想法该怎么解决这个吗?

0 投票
4 回答
2610 浏览

rdf - 获取 DBPedia Infobox 类别

我目前正在寻找一种通过 SPARQL 端点查询DBPedia 的 Infobox Onyology 数据库的方法,以获取类列表、所选类的子类以及给定类的属性。据我所知,您要么需要知道您正在寻找的属性,要么搜索特定的东西——我发现的所有示例似乎都基于您想要搜索特定的东西的想法(例如高于一定海拔的城市人口等),而我想构建一些可以有效“浏览”类别的东西。例如,从这个类层次图上“owl:Thing”的子类列表开始并向用户呈现所选子类的子类列表。似乎可以通过映射 wiki 浏览类似的内容,但最好直接查询 SPARQL 端点。

是否有一些简单的 SPARQL 查询可以返回这些类的可用类和属性?

更新: 我想出了一种方法来获取它看起来的类层次结构,通过迭代这个查询:

它返回 owl:Thing 的子类列表,如果我用其中一个子类替换 owl:Thing,我会得到该子类的子类列表,直到没有子类,此时我可以选择所有具有由所选子类给出的类型。不过,我仍然不太确定如何获取子类共有的所有属性。

更新 2 现在越来越近了。这个查询让我得到所有的属性(dbpedia:property 的子级)也是一个国家,以及它们的标题:

这实际上是我真正要求的。我现在要做的最后一件事是尝试按它们出现的页数对它们进行排序(大概最常见的属性将是最感兴趣的属性)。

0 投票
1 回答
334 浏览

frameworks - 设置自己的 DBpedia 服务器以创建新的映射

我想扩展 DBpedia 的映射数据库。因此,我想在我的计算机上运行我自己的提取框架实例。尽管后者只是简单地完成了,但我无法弄清楚如何为框架提供新创建的映射。

到目前为止我发现了什么:

  • 在“config.properties”中,我可以定义自己的转储文件夹。
  • 也可以定义一些输出目录。但是那里究竟存储了什么?
  • 在“Configuration.scala”中定义了映射页面的 url。这是否意味着框架需要一个网页作为输入,然后搜索映射?

我的目标是在纯文本文件中定义一些映射,然后以某种方式告诉提取框架将此文件用作所有映射的源。如果一切顺利,我将把我的成果贡献给 dbpedia 团队。

谢谢你的帮助!

0 投票
3 回答
17723 浏览

distinct - 在 SPARQL 中选择一些不同的和一些不不同的标签

我正在尝试查询 DBPedia 以获取与本体中给定类相关的属性列表,但由于人类可读的“标签”并不总是清晰的,我还想提供数据库中的示例。问题是,虽然我想选择所有不同的属性,但我只想要每个属性的一个示例。这是我的查询在不捕获示例的情况下的外观:

如果我以这种方式更改它,我开始获得 ?prop 的重复值:

一般来说,我对使用 SPARQL 和数据库查询非常陌生,所以我完全不清楚如何做到这一点。理想情况下,我会有类似 DISTINCT(?prop) ?title ?example 的东西,它为 prop 选择每个唯一值,并返回其标题和示例。

0 投票
1 回答
1632 浏览

sparql - 来自 DBpedia 和 Jena 的 SPARQL XML 结果

我从 DBpedia SPARQL 端点获得以下 XML:

当我和 Jena 一起阅读它并尝试扫描它时:

我总是得到以下异常:

这是耶拿虫还是别的什么?

编辑:为了完整起见,我报告了一个关于这个错误的线程

当来自 bio2rdf 邮件列表的一些帮助时,我们能够更多地追踪错误。

Arq 2.8.3 工作正常 Arq 2.8.4 失败并出现描述的错误 Arq 2.8.5 失败并出现描述的错误 所以我想我会保留 Art 2.8.3 进行测试。让我知道是否可以帮助更多地调试此错误。

诡异的。错误来自 STaX 解析器 - 所有基本级别的 XML 解析都分包给 Woodstox。几乎是它的读取速度快于输入到达并看到 EOF 而不是阻塞新输入。我尝试读取整个流,然后解析读取的字节,它工作正常。为什么 2.8.3 应该有所不同,目前我不清楚这可能只是时机。

解决方法:使用以下命令切换 XML 解析器:

ARQ.getContext().setTrue(ARQ.useSAX) ;

在调用 QueryExecutionFactory.sparqlService 之前

0 投票
7 回答
3615 浏览

random - 如何从 SPARQL 中选择随机 DBPedia 节点?

如何使用 sparql 端点从 DBpedia 中选择随机样本?

这个查询

(在此处找到)似乎在大多数 SPARQL 端点上都可以正常工作,但在http://dbpedia.org/sparql上它会被缓存(因此它总是返回相同的 10 个节点)。

如果我从 JENA 尝试,我会收到以下异常:

而且我找不到'bif'命名空间是什么。

关于如何解决这个问题的任何想法?

穆龙

0 投票
1 回答
681 浏览

java - 如何通过使用 jena 提供属性名称来获取 dbpedia 中属性的命名空间?

我正在尝试使用 jena http://dbpedia.org/page/Black_Sabbath中的 sparql 在以下 dbpedia 链接中获取属性类型的值

但我不知道如何从 dbpedia 获取属性名称空间(在我的示例中为dbpedia-owl .genre),我不想对其进行硬编码。任何人都可以帮助我lz...

非常感谢