我对 Python 很陌生,我也进行了很多搜索以找到与我类似的问题。我想做一些类似于这个问题中解释的事情 Computing averages of records from multiple files with python
但是,我不想取每个值的平均值(如本例中所有值都是数字),我想取单个列的平均值,但保留其他列的所有相同值“
例如:
fileA.txt:
0.003 0.0003 3 Active
0.003 0.0004 1 Active
fileB.txt:
0.003 0.0003 1 Active
0.003 0.0004 5 Active
我想生成以下输出文件
output.txt
0.003 0.0003 2 Active
0.003 0.0004 3 Active
尽管第 1 列和第 2 列也是数字,但对于 100 个文件的相同位置,它们将是相同的值。所以我只对第 3 列 100 个文件中每个元素的平均值感兴趣。
此外,尽管问题Computing averages of records from multiple files with python中的代码适用于读取我的文件。如果您有很多文件,它就没有用。我该如何优化呢?
我设法使用以下代码读取我的文件:
import numpy as np
result = []
for i in my_files:
a = np.array(np.loadtxt(i, dtype = str, delimiter = '\t', skiprows = 1))
result.append(a)
result = np.array(result)
我使用了这个问题中建议的类似代码初始化一个numpy数组
我的每个文件每 4 列大约有 1500 行。我尝试使用np.mean但它不起作用可能是因为我的一些数据是字符串类型。
在此先感谢您的帮助!