1

有一个名为SMOTE(Synthetic Minority Oversampling Technique)的模块增加了欠采样数据的样本数量,我想我们应该选择一个表示不足的特征(要预测的特征)。如何选择它?似乎没有选择列的选项。

4

3 回答 3

3

我猜你指的是目标变量(标签列)。您可以使用元数据编辑器模块进行设置。使用列选择器选择标签列,并将 Fields 属性设置为 Labels。

于 2015-03-02T03:12:27.183 回答
2

这是 SMOTE 的定义 - SMOTE 是一种从不平衡数据集构建分类器的方法,即分类类别的表示不大致相等。分类类别是分类器试图学习的特征。在 SMOTE 模块中没有选择列的选项,因为它应该是标签列

以下是有关如何在 Azure 机器学习中使用 SMOTE 的详细信息 - https://msdn.microsoft.com/en-us/library/azure/dn913076.aspx?f=255&MSPPError=-2147217396

于 2015-03-05T16:54:49.570 回答
1

您可以通过列选择器来完成。在下面的示例中,献血数据(Azure ML 中的示例数据集)有 25% 的人进行了献血(第 1 类)。

在此处输入图像描述

于 2015-12-18T14:29:59.153 回答