我有数千个从模型输出的数据单元格,我的结果格式如下:单元格 ID 是列标题,每一行是一个时间步长,每个单元格在数百个时间步长上的结果都打印在电子表格中。我想分析某些百分位数内的数据。我已经确定了感兴趣的百分位阈值的值是什么,但我没有找到关于如何...
a) 对于我正在使用的工作表,删除所有超出我感兴趣范围的值
或者
b)将感兴趣范围内的值从工作表中拉出并放入单独的一个以进行进一步分析
这些值是带两位小数的数字。
我需要在单独的步骤中清理数据,然后对其进行分析。例如,即使在删除时间序列中的极端最大值和最小值之后,我仍然希望查看整个时间序列,但将异常值删除或更改为空值。如何从该数据矩阵中选择或简单地删除所有异常值,而保留其余数据?