我希望从维基百科页面(仅包含信息框的页面)中获取所有信息框属性和值。使用简单的 WebRequest 解析信息框会给我太多的垃圾。因此,我考虑使用dbpedia并使用 Jena (SPARQL) 获取数据。我怎样才能做到这一点?是否有一个简单的查询可以将所有属性作为键值对提供给我?或RDF,然后将其转换为我需要的。
问问题
1025 次
2 回答
0
在http://dbpedia.org/sparql有一个到 dbpedia 的公共 SPARQL 端点,您可以使用它来进行实验。http://wiki.dbpedia.org/OnlineAccess中描述了用于构建查询的示例和各种其他工具。您还可以下载数据集以在本地尝试查询。
澄清一下,RDF 是 dbpedia 发布的数据格式。SPARQL 是用于查询 RDF 的查询语言。Jena 是一个包含 RDF 数据存储和 SPARQL 引擎的特定实现。
于 2011-12-10T21:18:31.650 回答
0
尝试使用来自http://wiki.dbpedia.org/Downloads37的转储。例如“原始信息框属性”。
于 2012-02-02T12:56:53.163 回答