我正在编写一个代码来对数据进行分类,并获得平均值和标准偏差。这是我的数据示例。
3917 1 -0.662261 25.148 22.9354 68.8076
3918 1 12.7649 18.7451 7.68473 69.0063
3919 1 -9.56836 -23.3265 -61.953 68.8357
3920 1 11.6292 31.6525 -29.3697 69.1372
3921 2 26.4837 -66.7897 12.0257 69.2282
3922 1 -9.81652 14.3788 9.38343 69.1217
3923 2 39.931 -88.1879 109.498 69.1604
3924 1 4.5502 3.53887 -6.59604 69.486
3925 2 13.6801 -24.6628 -5.7568 69.9398
3926 1 -10.5635 7.05517 -8.82785 70.2263
如您所见,有 6 列。我在这里考虑三步计算。
根据第 6 列对这些数字进行分类。第 6 列由 0 ~ n 的浮点数组成。我希望生成 n 个部分(或子矩阵,或其他),例如 0~1、1~2、2~3 .... n-1 ~ n。最后一个数字应该是最后一个数据的向上数,因为我希望做出部分。例如,如果最后一个数字是 121.2513,则最后一段应该是 120~121 以包含该数据。
将第 1~5 列的所有其他编号重新分配到基于第 6 列的相应小节中。如果特定部分没有编号,则将其打印为 0。将有 n 个子部分。每个小节中的元素数量将是随机的。
获取每个小节的第 3、4、5 列的平均值和标准差,并将 '小节中的元素数,小节的开始数,以及第 3、4 和 5 列的平均值和标准差写入输出文件柱子'
我正在尝试使用多个 for 循环,但它变得太复杂了,并且出错了。有没有其他简单的方法来对数据进行分类、处理每个子部分并在 Python 中打印出来?此外,我的 for 循环根本不起作用。任何使用此数据的简单示例建议?