0

我正在寻找一个包(实际上是任何语言),我可以在 50 个文档的语料库上使用它来执行各种指标的文档间相似性测试,例如 tfidf、okapi、语言模型、lsa 等。

因此,我想要一个文档相似度矩阵,即 doc1 与 doc2 相似 x%,等等……这是出于研究目的,而不是用于生产。我特别想要文档相似度矩阵,因为我想将其与人类评级相关联。

先感谢您!

4

1 回答 1

0

如果你知道 python,你可以使用http://www.nltk.org - 它有你需要的一切,另外还有文档和 python 语言

于 2010-05-02T17:48:56.163 回答