我有来自我运行的一个实验的 30 次重复运行的 30 个 csv 数据文件。我正在使用 pandas 的read_csv()
函数将数据读入 DataFrames 列表。我想从这个列表中创建一个 DataFrame,其中包含每列 30 个 DataFrame 的平均值。有没有内置的方法来实现这一点?
为了澄清,我将在下面的答案中扩展示例。假设我有两个 DataFrame:
>>> x
A B C
0 -0.264438 -1.026059 -0.619500
1 0.927272 0.302904 -0.032399
2 -0.264273 -0.386314 -0.217601
3 -0.871858 -0.348382 1.100491
>>> y
A B C
0 1.923135 0.135355 -0.285491
1 -0.208940 0.642432 -0.764902
2 1.477419 -1.659804 -0.431375
3 -1.191664 0.152576 0.935773
我应该使用什么合并函数来使用 DataFrame 创建一个 3D 数组?例如,
>>> automagic_merge(x, y)
A B C
0 [-0.264438, 1.923135] [-1.026059, 0.135355] [-0.619500, -0.285491]
1 [ 0.927272, -0.208940] [ 0.302904, 0.642432] [-0.032399, -0.764902]
2 [-0.264273, 1.477419] [-0.386314, -1.659804] [-0.217601, -0.431375]
3 [-0.871858, -1.191664] [-0.348382, 0.152576] [ 1.100491, 0.935773]
所以我可以计算这些列表而不是整个列的平均值、sem 等。