我正在使用胡萝卜2 的 STC(后缀树聚类)算法对一堆文档进行聚类。默认情况下,算法形成的最大聚类数为16。有没有办法决定生成的集群数量?
下面是调用 STC 集群的代码。
ProcessingResult byDomainClusters = controller.process(documents, null, STCClusteringAlgorithm.class);
List<Cluster> clustersByDomain = byDomainClusters.getClusters();
ConsoleFormatter.displayClusters(clustersByDomain);