我有以下玩具df:
FilterSystemO2Concentration (Percentage) ProcessChamberHumidityAbsolute (g/m3) ProcessChamberPressure (mbar)
0 0.156 1 29.5 28.4 29.6 28.4
2 0.149 1.3 29.567 28.9
3 0.149 1 29.567 28.9
4 0.148 1.6 29.6 29.4
这只是一个示例。原来有超过 1200 行。对其进行过采样以保留其统计特性的最佳方法是什么?
我用谷歌搜索了一段时间,我只遇到了不平衡类的重采样算法。但这不是我想要的,无论如何我对平衡数据不感兴趣,我只是想以或多或少保留原始数据分布和统计属性的方式产生更多样本。
提前致谢