我想在这里得到一些指导。我一直在尝试为我的项目标准化 TF-IDF 结果。所以,我在想TF-IDF 之后的下一步是什么?我想对那些标准化的 TF-IDF 进行 k-means 聚类,但现在是时候了吗?在此之前,我使用 Lucene 创建了索引,如果可能的话,我不想使用 Mahout,因为我使用的是 Windows(也不想使用 cygwin)。
关于用这些 lucene-ed 和 tf-idf-ed 结果做什么(以及如何)做 k-means的任何建议?我在这里迷路了..
我想在这里得到一些指导。我一直在尝试为我的项目标准化 TF-IDF 结果。所以,我在想TF-IDF 之后的下一步是什么?我想对那些标准化的 TF-IDF 进行 k-means 聚类,但现在是时候了吗?在此之前,我使用 Lucene 创建了索引,如果可能的话,我不想使用 Mahout,因为我使用的是 Windows(也不想使用 cygwin)。
关于用这些 lucene-ed 和 tf-idf-ed 结果做什么(以及如何)做 k-means的任何建议?我在这里迷路了..