我已经在我的系统中实现了 k 最近算法。它由 26 个类组成,每个类 100 个样本。在我的例子中,K=7,为了得到最好的分类结果完全是反复试验。
我知道应该明智地选择 K 以减少分类上的噪音。但是样本数量呢?是否有诸如“样本越多结果越好”之类的一般规则?它取决于什么?
感谢您的所有回复。
我已经在我的系统中实现了 k 最近算法。它由 26 个类组成,每个类 100 个样本。在我的例子中,K=7,为了得到最好的分类结果完全是反复试验。
我知道应该明智地选择 K 以减少分类上的噪音。但是样本数量呢?是否有诸如“样本越多结果越好”之类的一般规则?它取决于什么?
感谢您的所有回复。