我想使用 Python 找到两个单词之间的相关性(而不是相似性)。hso(Hirst 和 St-Onge,1998)、lesk(Banerjee 和 Pedersen,2003)和向量(Patwardhan,2003)算法在这里用 Perl 实现,但我似乎在 nltk 库中找不到与 Python 相同的算法。
我需要使用 Python,因为它是 Python 中一个更大的团队项目的一部分。有什么线索吗??
我想使用 Python 找到两个单词之间的相关性(而不是相似性)。hso(Hirst 和 St-Onge,1998)、lesk(Banerjee 和 Pedersen,2003)和向量(Patwardhan,2003)算法在这里用 Perl 实现,但我似乎在 nltk 库中找不到与 Python 相同的算法。
我需要使用 Python,因为它是 Python 中一个更大的团队项目的一部分。有什么线索吗??
还有一个您可以访问的 Web 界面 - 您大概可以编写一个 python 客户端来查询 Web 界面以获取 lesk 或向量值。
您可以在此处找到这些 Web 界面...
http://marimba.d.umn.edu http://talisker.d.umn.edu
祝你好运,特德
我使用 NLTK 将 WordNet 加载到 Neo4j 图形数据库中(参见https://groups.google.com/d/topic/gremlin-users/C1OlTG9xCpo/discussion)。
我使用 Bulbs ( http://bulbflow.com/ ) 创建了一个名为 WordGraph 的库,用于通过 Rexster REST 服务器 ( https://github.com/tinkerpop/rexster/wiki/ ) 与 Neo4j/WordNet 进行交互。
Bulbs 是一个 Python 库,它允许您使用图形编程语言 Gremlin ( https://github.com/tinkerpop/gremlin/wiki ) 来查询/遍历 Neo4j,在这种情况下,特别是 WordNet。
我正在将 WordGraph 发布到 Github(https://github.com/espeed/wordgraph)——如果您有任何问题,请给我留言。
如果您已经有 perl 实现,为什么不编写一个调用 perl 代码的 python 包装器呢?这样,您的 python 项目就可以使用该功能,而您不必重写实际的算法。nltk 中有很多东西已经以这种方式工作了。