6

Java中是否有任何LSI的开源实现?我想将该库用于我的项目。我见过 jLSI,但它实现了其他一些 LSI 模型。我想要一个标准模型。

4

6 回答 6

5

您是否考虑过 LDA(潜在狄利克雷分配)?我也没有,但我最近在 LSI 上遇到了同样的问题(专利)。据我了解,LDA 是一种相关/更强大的技术。http://en.wikipedia.org/wiki/Latent_Dirichlet_allocation显然有一些指向开源实现的链接。

于 2009-12-26T21:23:44.813 回答
1

谷歌搜索 java LSI 会导致一个类似的问题,推荐 SemanticVectors。构建在 Lucene 之上的与 LSI“相似”的包。我不知道它是否比 jLSI 实现更接近。

该线程还提到 LSI 已获得专利,并且没有很多实现。因此,如果您需要标准实现,则可能必须使用 java 以外的语言。

于 2009-12-07T19:46:33.583 回答
1

S-Space 包具有 LSA的开源版本,具有 LSI 文档向量的绑定。(这两种方法都在相同的术语文档矩阵上运行,并且除了输出之外是等价的。)这是一种使用 Thin-SVD 的相当可扩展的方法。我已经用它在所有维基百科上毫无问题地运行 LSI(在删除了出现次数少于 5 次的不常用术语之后)。

正如 Scott Ray 所提到的,SemanticVectors 包也有一个很好的 LSI 实现,它最近切换到使用相同的瘦 SVD (SVDLIBJ),所以你可能会像以前一样检查一下。

于 2011-03-17T00:31:14.410 回答
1

谷歌搜索 NLP 工具提供了这张幻灯片,我认为这有帮助......

于 2012-05-02T07:13:35.727 回答
0

我认为 LSA/LSI 是在 1989 年获得专利的,这意味着专利应该刚刚到期。希望我们很快就会看到一些不错的开源应用程序。

于 2010-05-17T21:43:53.457 回答
0

你试过语义向量包吗?

http://code.google.com/p/semanticvectors/

于 2011-08-10T12:36:40.543 回答