我猜我对一个可以回答而不是仅仅讨论的问题如履薄冰,因为从我的研究来看,Facebook 的 Graph Search似乎处于隐身模式,除了这个之外,Facebook 没有什么正式共享的。
我对 facebook 如何让它发挥作用很感兴趣。所以我一直在玩 OpenNLP 和 POS Tagger(词性)。我已经做到了这一点,但后来很明显自然语言存在多少细微差别,有点知道但不尊重它,直到我一起破解了一些东西。
所以我走到这一步 -
[Debug] Question :: Friends from France who like England
[Debug] Token = Friends :: POS = NNS
[Debug] Token = from :: POS = IN
[Debug] Token = France :: POS = NNP
[Debug] Token = who :: POS = WP
[Debug] Token = like :: POS = VBP
[Debug] Token = England :: POS = NNP
其中 POS 是此处所述的词性
我想我可以从那里获取 POS 标签,并且我有一个规则集在我的架构中查找类似的术语?规则似乎是一种脆弱的方法。也许我应该有一个本体,以便在那里有一些与朋友有关的东西?对于三重商店来说,这个问题似乎“更容易”,其中语义已经被标记,例如“詹姆斯”、“喜欢”、“英格兰”,而我还有另一个三重商店,其中“詹姆斯”、“来自”、“法国”基本上只是只是 SQL 中的一个联接。
这纯粹是学术性的,晚上有点小技巧。我只是对这对他们有用。这个谷歌搜索引发了一些有趣的事情。
所以具体的问题是,图搜索是如何工作的?自然语言如何映射到他们使用的查询/数据存储?除了 Wolfram Alpha,还有其他这类事情的好例子吗?有什么开源的吗?我应该去阅读这里使用了哪些计算机科学概念?
干杯
大卫