0

我想读取一个非常糟糕的文本文件,因为每行中的值有时没有用空格或逗号分隔(所以我不能使用 .split())。我想像在 FORTRAN 中那样阅读它,在那里我准确地告诉它每个值在哪里。这就是我正在尝试的。有谁知道更好的方法来做到这一点?谢谢 !

f=open('f.out','r')

lines = f.readlines()

nLines = len(lines)
data = {}


keys = {'SPE':[0, 2, np.int],              #I2
      'SPEISO':[2, 3, np.int],         #I1
      'wnum':[3,15, np.float64],       #F12.6
      'S':[15, 25, np.float64],     #E10.3
      'Ecoeff':[25, 35, np.float64],     #E10.3
      'AGA':[35, 40, np.float64],     #F5.5
      'SGA':[40, 45, np.float64],     #F5.4
      'ELO':[45, 55, np.float64],     #F10.4
      'N'  :[55, 59, np.float64],     #F4.2
      'FSH':[59, 67, np.float64],     #F8.6
      'TRS':[67, 127, np.str],
      'IERR': [127, 133, np.int],
      'IEFF': [133, 145, np.str],
      'other': [145,160, np.str]  }

for k in keys:
  data[k] = np.zeros(nLines)

for i, l in enumerate(lines):
 print i
  for k in keys:
    print k
    data[[k][i]] = l.format(keys[k])
4

1 回答 1

1

您也许可以使用pandas库中的read_fwf函数。

就像是:

import pandas
pandas.read_fwf('f.out', 
   colspecs=[x[:2] for x in keys.values()],
   dtype=[x[2] for x in keys.values()]
   )
于 2013-02-02T22:36:13.107 回答