0

我有大量包含感兴趣数据的 .txt 文件(N > 1000),我希望识别其“平均值”值超过给定阈值(例如 0.5)的文件,并打印其中包含就是这样。每个文件中的数据组织如下:

[
    {
      "parameter": {
          "max": 0.6640571758027143,
          "mean": 0.13404294175225137,
          "min": 0.0,
          "std": 0.09435715828616785
      },
      {
        "intensity": [
            {
                "max": [
                    3.1719575216784217
                ],
                "mean": [
                    -3.552713678800501e-17
                ],
                "min": [
                    -2.707115982837323
                ],
                "std": [
                    1.0000000000000004
                ]
                ...

为了使事情稍微复杂一些,我只想阅读“参数”的“平均值”而不是“强度”。

我有一个想法,我应该使用 for 循环读取这个文件,大致包含以下代码:

subjects = [allmyfilenames]
for subj in subjects:
    file = open('C:/%s.txt' %subj, 'r')
    for line in file.readlines(): print line

从那里,我有点迷路了。我如何识别用于匹配我的阈值 (0.5) 的正确线?

4

1 回答 1

0

尝试这样的事情,我不完全确定你的数据格式,但这样的事情可能适用于上面的数据格式。未测试**

subjects = [allmyfilenames]
    for subj in subjects:
        with open('C:/%s.txt' %subj, 'r') as datafile:
            data = json.load(datafile)
            if data[0]['parameter']['mean'] > 0.5:
                print subj
于 2012-11-06T03:59:42.647 回答