这些天我正在使用一些聚类算法,我只是想问一个与这个领域相关的问题。也许在这个领域工作的人已经有了这个答案。
在聚类期间,我需要一些要聚类的训练数据。迭代次数(例如 K-Means 算法)取决于训练数据的数量(向量的数量)。有什么方法可以从训练数据中找到最重要的数据。我的意思是:不是用所有数据训练 K-Means,也许有一种方法可以只找到重要的向量(那些影响最多集群的向量)并使用这些“重要”向量(来自训练数据)来训练算法。
我希望你能理解我。感谢您阅读并尝试回答。
这些天我正在使用一些聚类算法,我只是想问一个与这个领域相关的问题。也许在这个领域工作的人已经有了这个答案。
在聚类期间,我需要一些要聚类的训练数据。迭代次数(例如 K-Means 算法)取决于训练数据的数量(向量的数量)。有什么方法可以从训练数据中找到最重要的数据。我的意思是:不是用所有数据训练 K-Means,也许有一种方法可以只找到重要的向量(那些影响最多集群的向量)并使用这些“重要”向量(来自训练数据)来训练算法。
我希望你能理解我。感谢您阅读并尝试回答。