3

我有一组来自 Facebook 的兴趣和喜欢数据,我有兴趣使用来自其他来源(即 Freebase)的数据来丰富这些数据。有什么方法可以识别 Freebase 中的哪个条目与 Facebook Graph 中的给定条目对应?

首先,Facebook Graph 不提供任何指向外部资源的链接,因此似乎需要在外部资源中找到任何类型的关系。我发现,至少对于某些条目,Freebase 提供了一个“Facebook URL”,因此您可以通过一种迂回的方式将两者联系起来。例如,对于乐队“Taking Back Sunday”,这里是 Facebook Graph URL:

https://graph.facebook.com/23854511408

... 或者可以使用虚 URL:

https://graph.facebook.com/TakingBackSunday

现在在 Freebase 中,如果我查看 RDF 格式 (http://rdf.freebase.com/rdf/en.taking_back_sunday) 或 JSON 格式的 Take Back Sunday 条目,我可以看到 Facebook 虚荣 URL 的链接。假设 MQL 可以查询此属性,则可以通过此方法将 Freebase 链接到 Facebook Graph。然而问题是 Freebase 中的许多条目没有到 Facebook 的链接。

关于是否有一致的方法来发现这些联系有什么想法吗?

4

2 回答 2

4

如果您可以将 Facebook 图形数据转换为 RDF 格式,并且如果您对跨数据集连接特定类型的实体(例如波段)感兴趣,那么您可以使用Silk 之类的链接发现工具。您编写一个映射,告诉 Silk 如何比较名称、流派、家乡等,然后 Silk 将计算连接。不过,这需要相当多的努力。

另一种选择可能是使用Google Refine,它具有“协调”功能,可以发现与您的数据匹配的 Freebase 实体。挑战又是如何将 Facebook 数据输入 Google Refine。

于 2012-05-01T23:52:44.710 回答
4
  1. 从您的兴趣和喜欢列表中创建一个电子表格,其中包含名称和 FB 图 URI 列。
  2. 将电子表格加载到Google Refine中。
  3. 将名称列与 Freebase 协调一致
  4. 使用以下 GREL 代码根据您的协调名称列为 Freebase URI创建一个新列:

    "http://rdf.freebase.com/ns/" + cell.recon.match.id[1,-1].replace("/", ".")

  5. 将您的增强数据导出到新的电子表格。

于 2012-05-02T02:24:59.463 回答