java - java - tf*idf 实现？

Question

我基本上是在创建一个搜索引擎，我想实现 tf*idf 来根据搜索查询对我的 xml 文档进行排名。我该如何实施？我该如何启动它？任何帮助表示赞赏。

score 2 · Accepted Answer

2

令人惊讶的是，这里没有提到 Weka 库。Weka 的StringToWordVector 类实现了 TF-IDF。

于 2015-09-18T11:02:31.983 回答

score 1 · Accepted Answer

1

tfidf是一个独立的 Java 包，用于计算 Tf-Idf。

于 2014-08-30T16:51:04.513 回答

score 1 · Accepted Answer

我过去是这样做的，我使用Lucene来获取 TD*IDF 数据。

不过，这需要相当多的摆弄，所以如果有其他人们知道更容易的解决方案，那就使用它们。

score 1 · Accepted Answer

Apache Mahout：

我相信它需要一个 Hadoop 文件系统，这是一项额外的工作。但效果很好。

4 回答 4