我的训练数据集仅包含 2 个具有 40 个特征的类。
在案例 1 中,第 1 类有 35 个样本,第 2 类有 700 个样本。
在案例 2 中,第 1 类有 65 个样本,第 2 类具有与上述相同的值。
我的训练数据集是否足以使用 SVM 分类器或其他分类器构建模型?
我正在使用 WEKA。测试选项是10 倍交叉验证和%66,我得到了非常好的结果。
我的训练数据集仅包含 2 个具有 40 个特征的类。
在案例 1 中,第 1 类有 35 个样本,第 2 类有 700 个样本。
在案例 2 中,第 1 类有 65 个样本,第 2 类具有与上述相同的值。
我的训练数据集是否足以使用 SVM 分类器或其他分类器构建模型?
我正在使用 WEKA。测试选项是10 倍交叉验证和%66,我得到了非常好的结果。
您对结果感到满意,因此这意味着您有足够的数据。很难说您需要多少数据,这取决于您要解决的具体问题、您拥有的数据噪声量、功能等。
我在第二部分中描述了它:https ://stackoverflow.com/a/31567143/1030820