我有一组用于机器学习的加权特征。我想减少功能集,只使用重量非常大或非常小的那些。
因此,在下面的排序权重图像中,我只想使用权重高于较高或低于较低黄线的特征。
我正在寻找的是某种斜率变化检测,因此我可以丢弃所有特征,直到第一个/最后一个斜率系数增加/减少。
虽然我(认为我)知道如何自己编写代码(使用一阶和二阶数值导数),但我对任何已建立的方法都感兴趣。也许有一些统计数据或索引可以计算类似的东西,或者我可以从 SciPy 使用的任何东西?
编辑:
目前,我使用1.8*positive.std()
的是正阈值和1.8*negative.std()
负阈值(快速而简单),但我不是足够的数学家来确定这是多么强大。不过,我认为不是。⍨</p>