我基本上是在创建一个搜索引擎,我想实现 tf*idf 来根据搜索查询对我的 xml 文档进行排名。我该如何实施?我该如何启动它?任何帮助表示赞赏。
问问题
13301 次
4 回答
2
令人惊讶的是,这里没有提到 Weka 库。Weka 的StringToWordVector 类实现了 TF-IDF。
于 2015-09-18T11:02:31.983 回答
1
tfidf是一个独立的 Java 包,用于计算 Tf-Idf。
于 2014-08-30T16:51:04.513 回答
1
我过去是这样做的,我使用Lucene来获取 TD*IDF 数据。
不过,这需要相当多的摆弄,所以如果有其他人们知道更容易的解决方案,那就使用它们。
于 2012-04-18T13:56:09.727 回答
1
Apache Mahout:
我相信它需要一个 Hadoop 文件系统,这是一项额外的工作。但效果很好。
于 2016-09-29T02:47:49.203 回答