我已经成功运行了 mahout lda,并使用命令 mahout ldatopics 显示了输出。
例如,我的主题是科学和体育。那么输出将是:主题 0 篮球,比赛,棒球主题 1 研究,研究,哲学
我现在的问题是如何识别单个文章的组或集群。是否有 ID 号或某种跟踪,以便对于我添加的每篇新文章,它将被分组或添加到特定的集群/主题。
如果我已经有了集群,下一步是什么?
谢谢
我已经成功运行了 mahout lda,并使用命令 mahout ldatopics 显示了输出。
例如,我的主题是科学和体育。那么输出将是:主题 0 篮球,比赛,棒球主题 1 研究,研究,哲学
我现在的问题是如何识别单个文章的组或集群。是否有 ID 号或某种跟踪,以便对于我添加的每篇新文章,它将被分组或添加到特定的集群/主题。
如果我已经有了集群,下一步是什么?
谢谢