这是许多 txt 文件中的一个的副本。
Class 1:
Subject A:
posX posY posZ x(%) y(%)
0 2 0 81 72
0 2 180 63 38
-1 -2 0 79 84
-1 -2 180 85 95
. . . . .
Subject B:
posX posY posZ x(%) y(%)
0 2 0 71 73
-1 -2 0 69 88
. . . . .
Subject C:
posX posY posZ x(%) y(%)
0 2 0 86 71
-1 -2 0 81 55
. . . . .
Class 2:
Subject A:
posX posY posZ x(%) y(%)
0 2 0 81 72
-1 -2 0 79 84
. . . . .
- 班级、科目、行条目的数量都各不相同。
- Class1-Subject A 总是有 posZ 条目,其中 0 与 180 交替
- 按班级和科目计算 x(%)、y(%) 的平均值
- 按类别和主题计算 x(%)、y(%) 的标准偏差
- 在计算平均值和 std_deviations 时也忽略 180 行的 posZ
我在 excel 中开发了一个笨拙的解决方案(使用宏和 VBA),但我宁愿在 python 中寻求更优化的解决方案。
numpy 非常有用,但 .mean()、.std() 函数仅适用于数组——我仍在研究它以及 panda 的 groupby 函数。
我希望最终输出如下所示(1. 按类别,2. 按主题)
1. By Class
X Y
Average
std_dev
2. By Subject
X Y
Average
std_dev