“dbpedia”的相关标签问题_Stack Overflow中文网

0 投票

1 回答

10166 浏览

sparql - 如何正确使用 SPARQL OPTIONAL 来检索可能存在的资源的属性？

我正在尝试使用 SPARQL 查询来检索有关 DBpedia 资源（人）的信息。我想使用相同的查询通过参数化资源 URI 来检索有关任何 Person 的数据。由于特定资源可能不存在某些属性，因此我正在使用该OPTIONAL语句。这是我的查询：

除了 label、abstract 和 page in 之外，我已经保留了所有内容OPTIONAL，因为如果我对另一个人使用相同的查询，他们可能没有这些属性。问题是，这些可选属性都没有出现在结果中。birthDate在 Neil Simon 的案例中，您可以看到birthPlace和的值：http thumbnail: //dbpedia.org/resource/Neil_Simon。但是，当我运行查询时，这些值不会显示：DBpedia SPARQL query。我做错了什么，我怎样才能有选择地检索这些属性？

sparql dbpedia

2011-03-01T23:13:09.437

0 投票

3 回答

928 浏览

java - Dbpedia 提取框架 - 如何剥离 mediawiki 格式标记

我正在玩 dbpedia 提取框架。看起来很不错，我很高兴构建维基百科页面的 AST 并提取链接（使用 WikiParser）。然而，虽然我从解析中得到了一个很好的结构化树，但我注意到文本节点仍然包含许多格式标记（例如，用于斜体、粗体等的撇号）。出于我的目的，这些没有帮助 - 我只想要纯文本。

我可以花一些时间编写自己的代码来删除它，但我假设这样的东西对 dbpedia 很有用 - 并且它存在于库中的某个地方。我对吗？如果是这样 - 剥离到裸文本的额外功能在哪里？

否则 - 有没有人知道任何其他（最好是 scala）包来去除 mediawiki 标记？

编辑

应要求提供更多详细信息。以下标记：

来自 dbpedia 作为 TextNode 的内容，但未触及。我希望能够将其剥离为：

或者可能是一个更结构化的 AST，其附加节点表示原始文本的每个部分，可能（在每个节点上）用要应用的格式类型（例如斜体、粗体等）进行注释。

事实上，dbpedia 解析的最终结果仍然充满了标记。

希望有帮助。

2011-03-04T15:40:03.363

0 投票

2 回答

1406 浏览

sparql - DBpedia 和 SPARQL：带重音符号的查询不起作用

所以我尝试了很多不同的事情并一直在寻找解决方案，但没有任何运气......

我的 SPARQL 查询是

当 $term 等于名称中带有重音符号的东西时，它会全部搞砸并且没有给出结果。我尝试了很多不同的东西，但似乎无法让它们中的任何一个起作用。希望得到一些帮助。

谢谢

编辑

我正在使用 PHP 和 curl。这是我根据需要下载和修改的东西……这是它与 dbpedia 通信的部分。

$query 贴在上面，使用的格式是 json。

编辑 2

这是我正在使用的源代码。https://gist.github.com/380379也许查看完整代码会让您更好地了解问题所在。

我将包含带重音的姓氏的数据库字段更改为“utf8_unicode_ci”，但我仍然卡住了，找不到任何可行的解决方案。

sparql dbpedia

2011-03-05T00:15:51.520

0 投票

1 回答

555 浏览

sparql - 有句点的 DBpedia SPARQL 查询

我正在尝试获取曼联足球队的摘要，问题是 wiki 链接中有句点。当我尝试这个时，

由于FC后的时间段而返回错误

有想法该怎么解决这个吗？

sparql dbpedia

2011-03-06T00:49:17.370

0 投票

4 回答

2610 浏览

rdf - 获取 DBPedia Infobox 类别

我目前正在寻找一种通过 SPARQL 端点查询DBPedia 的 Infobox Onyology 数据库的方法，以获取类列表、所选类的子类以及给定类的属性。据我所知，您要么需要知道您正在寻找的属性，要么搜索特定的东西——我发现的所有示例似乎都基于您想要搜索特定的东西的想法（例如高于一定海拔的城市人口等），而我想构建一些可以有效“浏览”类别的东西。例如，从这个类层次图上“owl:Thing”的子类列表开始并向用户呈现所选子类的子类列表。似乎可以通过映射 wiki 浏览类似的内容，但最好直接查询 SPARQL 端点。

是否有一些简单的 SPARQL 查询可以返回这些类的可用类和属性？

更新： 我想出了一种方法来获取它看起来的类层次结构，通过迭代这个查询：

它返回 owl:Thing 的子类列表，如果我用其中一个子类替换 owl:Thing，我会得到该子类的子类列表，直到没有子类，此时我可以选择所有具有由所选子类给出的类型。不过，我仍然不太确定如何获取子类共有的所有属性。

更新 2 现在越来越近了。这个查询让我得到所有的属性（dbpedia:property 的子级）也是一个国家，以及它们的标题：

这实际上是我真正要求的。我现在要做的最后一件事是尝试按它们出现的页数对它们进行排序（大概最常见的属性将是最感兴趣的属性）。

rdf sparql dbpedia

2011-03-19T20:56:06.827

0 投票

1 回答

334 浏览

frameworks - 设置自己的 DBpedia 服务器以创建新的映射

我想扩展 DBpedia 的映射数据库。因此，我想在我的计算机上运行我自己的提取框架实例。尽管后者只是简单地完成了，但我无法弄清楚如何为框架提供新创建的映射。

到目前为止我发现了什么：

在“config.properties”中，我可以定义自己的转储文件夹。
也可以定义一些输出目录。但是那里究竟存储了什么？
在“Configuration.scala”中定义了映射页面的 url。这是否意味着框架需要一个网页作为输入，然后搜索映射？

我的目标是在纯文本文件中定义一些映射，然后以某种方式告诉提取框架将此文件用作所有映射的源。如果一切顺利，我将把我的成果贡献给 dbpedia 团队。

谢谢你的帮助！

frameworks mapping extraction dbpedia

2011-03-21T10:10:09.140

0 投票

3 回答

17723 浏览

distinct - 在 SPARQL 中选择一些不同的和一些不不同的标签

我正在尝试查询 DBPedia 以获取与本体中给定类相关的属性列表，但由于人类可读的“标签”并不总是清晰的，我还想提供数据库中的示例。问题是，虽然我想选择所有不同的属性，但我只想要每个属性的一个示例。这是我的查询在不捕获示例的情况下的外观：

如果我以这种方式更改它，我开始获得 ?prop 的重复值：

一般来说，我对使用 SPARQL 和数据库查询非常陌生，所以我完全不清楚如何做到这一点。理想情况下，我会有类似 DISTINCT(?prop) ?title ?example 的东西，它为 prop 选择每个唯一值，并返回其标题和示例。

distinct rdf sparql dbpedia

2011-03-22T18:29:02.330

0 投票

1 回答

1632 浏览

sparql - 来自 DBpedia 和 Jena 的 SPARQL XML 结果

我从 DBpedia SPARQL 端点获得以下 XML：

当我和 Jena 一起阅读它并尝试扫描它时：

我总是得到以下异常：

这是耶拿虫还是别的什么？

编辑：为了完整起见，我报告了一个关于这个错误的线程：

当来自 bio2rdf 邮件列表的一些帮助时，我们能够更多地追踪错误。

Arq 2.8.3 工作正常 Arq 2.8.4 失败并出现描述的错误 Arq 2.8.5 失败并出现描述的错误所以我想我会保留 Art 2.8.3 进行测试。让我知道是否可以帮助更多地调试此错误。

诡异的。错误来自 STaX 解析器 - 所有基本级别的 XML 解析都分包给 Woodstox。几乎是它的读取速度快于输入到达并看到 EOF 而不是阻塞新输入。我尝试读取整个流，然后解析读取的字节，它工作正常。为什么 2.8.3 应该有所不同，目前我不清楚这可能只是时机。

解决方法：使用以下命令切换 XML 解析器：

ARQ.getContext().setTrue(ARQ.useSAX) ;

在调用 QueryExecutionFactory.sparqlService 之前

sparql jena dbpedia stax

2011-04-07T13:21:49.263

0 投票

7 回答

3615 浏览

random - 如何从 SPARQL 中选择随机 DBPedia 节点？

如何使用 sparql 端点从 DBpedia 中选择随机样本？

这个查询

（在此处找到）似乎在大多数 SPARQL 端点上都可以正常工作，但在http://dbpedia.org/sparql上它会被缓存（因此它总是返回相同的 10 个节点）。

如果我从 JENA 尝试，我会收到以下异常：

而且我找不到'bif'命名空间是什么。

关于如何解决这个问题的任何想法？

穆龙

random sample sparql dbpedia

2011-04-15T13:15:22.557

0 投票

1 回答

681 浏览

java - 如何通过使用 jena 提供属性名称来获取 dbpedia 中属性的命名空间？

我正在尝试使用 jena http://dbpedia.org/page/Black_Sabbath中的 sparql 在以下 dbpedia 链接中获取属性类型的值

但我不知道如何从 dbpedia 获取属性名称空间（在我的示例中为dbpedia-owl .genre），我不想对其进行硬编码。任何人都可以帮助我lz...

非常感谢

java sparql jena dbpedia

2011-04-17T15:54:34.397

问题标签 [dbpedia]

Reference