3

我在一家正在为现场音乐建立场地/艺术家数据库的公司工作,最近遇到了 Freebase。它看起来非常引人注目,即使没有新的、崭露头角的乐队的数据。对于那些使用过 Freebase 的人,我有几个问题:

  1. 将所有数据输入与 Freebase 集成有缺点吗?我们不打算出售或私有化这些信息。

  2. Freebase 在可用性方面的弱点是什么?

4

1 回答 1

1

披露:我在 Google 的 Freebase 工作。

Freebase 中的音乐数据是我们最强大的领域之一,随着我们继续加载更多数据集,它将继续变得更广泛和更丰富。例如,我们从 MusicBrainz 导入数据,对其进行清理并将主题与 Freebase 中的现有主题进行匹配以避免重复。

  1. 就缺点而言,您应该准备好处理大量数据。例如,Freebase 目前有4 位名为“John Smith”的音乐艺术家,它们可能对您的应用程序有用,也可能没有用,但您仍然需要弄清楚哪些人映射到您的用户感兴趣的 John Smith。我们称之为“和解”,它是必要的,这样您的应用程序才能准确地知道要查询 API 的主题。

    既然你提到了音乐场所,我还应该指出,虽然 Freebase 有很多关于地点的数据,但我们还没有地理搜索 API,所以如果你需要的话,你需要自己推出。

    由于任何人都可以编辑 Freebase,因此您还应该考虑使用as_of_time来保护您的网站免受破坏。

  2. Freebase 非常适合开发人员,因为您可以轻松地介入并清理不良数据或添加缺失的主题。然而,一个一直是挑战的领域是从谷歌外部加载大量数据。我们已经构建了允许人们上传数据集的OpenRefine,但这些数据集必须通过需要一些时间才能完成的 QA 流程。拥有这些 QA 流程以保持 Freebase 的质量水平是必要的,但它确实减慢了加载大型数据集的过程。

我真的希望您选择使用 Freebase 音乐数据来建立您的公司。我知道已经有很多音乐初创公司乐于使用我们的数据。

于 2012-08-21T01:23:34.073 回答