我有大量包含感兴趣数据的 .txt 文件(N > 1000),我希望识别其“平均值”值超过给定阈值(例如 0.5)的文件,并打印其中包含就是这样。每个文件中的数据组织如下:
[
{
"parameter": {
"max": 0.6640571758027143,
"mean": 0.13404294175225137,
"min": 0.0,
"std": 0.09435715828616785
},
{
"intensity": [
{
"max": [
3.1719575216784217
],
"mean": [
-3.552713678800501e-17
],
"min": [
-2.707115982837323
],
"std": [
1.0000000000000004
]
...
为了使事情稍微复杂一些,我只想阅读“参数”的“平均值”而不是“强度”。
我有一个想法,我应该使用 for 循环读取这个文件,大致包含以下代码:
subjects = [allmyfilenames]
for subj in subjects:
file = open('C:/%s.txt' %subj, 'r')
for line in file.readlines(): print line
从那里,我有点迷路了。我如何识别用于匹配我的阈值 (0.5) 的正确线?