Carrot2 接受 XML 输入,这些输入包括来自它自己对一些其他文档的导出的“集群”。现在,如果我想实现增量聚类,即引入新文档,连同以前的集群,我也必须在输入中保留旧文档。这使得输入随着我们的进步线性增长。
有没有办法提取集群以及各个集群的文档特征,以解决这个增量/在线集群问题?
Carrot2 接受 XML 输入,这些输入包括来自它自己对一些其他文档的导出的“集群”。现在,如果我想实现增量聚类,即引入新文档,连同以前的集群,我也必须在输入中保留旧文档。这使得输入随着我们的进步线性增长。
有没有办法提取集群以及各个集群的文档特征,以解决这个增量/在线集群问题?