我有个问题。众所周知,ML.NET 是 .NET 的一个了不起的框架,它通过“自己”做很多事情,所以有时很难深入到里面。
我有具有 30 个不同特征的数据集。我害怕过度拟合,所以我正在寻找最简单的方法来删除不必要的。
例如,如果我想跳过第一列,我的Data.CS
可以看起来像这样吗?:
//skipped Column 0
[Column(ordinal: "1")]
public float RadiusMean;
[Column(ordinal: "2")]
public float TextureMean;
[Column(ordinal: "3")]
public float PerimeterMean;
我注意到,我们可以通过从特征中删除列来做到这一点;
pipeline.Add(new ColumnConcatenator(outputColumn: "Features",
"TextureMean",
"PerimeterMean",
"AreaMean",
//delete not necessery columns
通过这个,我们可以改进我们的结果。但如果它像“删除”训练模型的列一样工作?
第二个问题,是否有更快的方法来制作列?或者也许 ML.NET 中有从数据集中获取列的方法?