0

我有数千个从模型输出的数据单元格,我的结果格式如下:单元格 ID 是列标题,每一行是一个时间步长,每个单元格在数百个时间步长上的结果都打印在电子表格中。我想分析某些百分位数内的数据。我已经确定了感兴趣的百分位阈值的值是什么,但我没有找到关于如何...

a) 对于我正在使用的工作表,删除所有超出我感兴趣范围的值

或者

b)将感兴趣范围内的值从工作表中拉出并放入单独的一个以进行进一步分析

这些值是带两位小数的数字。

我需要在单独的步骤中清理数据,然后对其进行分析。例如,即使在删除时间序列中的极端最大值和最小值之后,我仍然希望查看整个时间序列,但将异常值删除或更改为空值。如何从该数据矩阵中选择或简单地删除所有异常值,而保留其余数据?

4

2 回答 2

2

最好的方法是使用数据透视表功能。

使用数据透视表,您将能够使用范围(主要数据和异常值)创建过滤器参数。

如果您不知道如何使用数据透视表,请看一下: 创建数据透视表来分析工作表数据

于 2017-08-15T00:09:42.243 回答
1

尽管“稳健”最简单的方法是过滤您的数据。在那之后,过滤掉你所有的好价值观。一旦只有“坏”单元格可见,然后转到特殊并仅突出显示可见单元格。从那里,删除。

为了有效地/使用键盘快捷键做到这一点,它会是这样的:

  • 1) 选择数据头并输入alt + h + s + f
  • 2)单击“值”标题,然后单击适当的数字,直到您拥有不想过滤掉的所有数据。
  • 3)突出显示所有剩余的单元格(这些应该是您要删除的数据点,excel中的行号现在应该是蓝色的)
  • 4) 键入alt + h + f + d + s + y以转到特殊并仅选择可见单元格
  • 5)键入alt + h + d + r以删除行(这将需要一些时间,请耐心等待)

我希望它有效!

***编辑:您也可以根据大小排名,而不是手动整理数据,然后直接切割数据。在考虑了更多答案之后,这种方法会更容易(我认为)并且更快。

于 2017-08-15T15:42:16.547 回答