9

是否有任何现有的方法可以使用 freebase 数据转储来创建类似于 freebase 提供的数据库,但在您自己的服务器上?几乎是免费的,但在本地而不是通过 API?

我想有可能创建,但是已经有任何现有的解决方案了吗?或者任何不使用 API 的类似数据的替代解决方案?我也没有为 dbpedia 找到这个:|

4

5 回答 5

7

freebase-quad-rdfize 的替代方法在这里:https ://github.com/castagna/freebase2rdf

我使用 Apache Jena 的 TDB 存储加载 RDF 数据,并使用 Fuseki 通过 HTTP 上的 SPARQL 协议提供数据。

也可以看看:

此外,您现在还有另一个选择:http ://basekb.com/

于 2012-03-11T18:45:16.017 回答
3

将数据导入您选择的三重存储并不难 - 但您将很难在合理的时间内获得任何答案,除非您正在做一些微不足道的事情。

几年前有人确实将整个数据集导入 MySQL - 加载需要 2 周,甚至像“作为一个人输入的事物的数量”这样的简单查询也需要超过 1 分钟才能给出答案。那是在大型硬件上,现在的数据集比以前大得多。

于 2011-01-29T17:47:59.087 回答
3

看看Google Code 上的 freebase-quad-rdfize项目。它应该允许您下载每周的Freebase quad 转储并将其加载到您选择的 RDF 三元存储中。

于 2011-01-31T19:49:42.157 回答
3

我是:BaseKB的创建者,这是 Freebase 到 RDF 的第一个可用转换。

Freebase quad 转储中存在关键完整性问题,这使得很难从 quad 转储中获得完全正确的结果。:BaseKB 重构了 Freebase 的关键结构,以便唯一名称假设成立。这很重要,因为编写像 SQL 查询一样工作的简单 SPARQL 查询的能力取决于此。

目前,:BaseKB 有两个版本。有一个免费版包含 1.2 亿个事实,大约 400 万个主题(来自维基百科的主题),还有一个包含所有内容的“专业”版。

至于 Phillip Kendall 提出的性能问题,我可以说这主要是有足够的 RAM 问题。使用 24GB 的 RAM,我可以在一小时内将免费版加载到三重存储中。有些查询花费的时间比我喜欢的要长,但整体查询性能很好。

任何想要使用“Pro”版本的人都将需要异常强大的硬件,并且会花费大量精力让他们的工具链正常工作。我现在正在与合作伙伴合作,以令人满意的方式向用户提供“Pro”。

于 2012-05-31T13:52:51.107 回答
1

如果您可以将数据库导出为 TXT 或数据库文件(如 MDB、XLS 或任何其他高度可传输的数据格式)中的制表符分隔值或逗号分隔值,那么使用它在计算机上构建自己的 MySQL 数据库没有问题数据。主要是确保您可以导出数据,您可以从中重建自己的数据库。

于 2011-01-29T16:26:23.427 回答