如果您不必使用numpy.genfromtxt()
,并且文件行的长度恒定(或变化缓慢或变化不大),您可以计算偏移量并使用file.seek()
来获得该偏移量。例如,用于os.stat()
找出文件大小,减去平均行长的 360 倍加上缓冲,查找,读取。
使用numpy.genfromtxt()
,您可能可以使用该skip_header
参数指定在读取数据之前要向前跳过多少行。例如,读取文件的第一行以找出文件开始的时间,并计算自该时间以来的分钟数。假设是minutesOld
分钟。skip_header = minutesOld - 360
在genfromtxt()
参数列表中说。
这样您就不必跳过很多行两次,在同一个 genfromtxt 调用中获取时间和临时数据。为此,请说(例如)
data = numpy.genfromtxt(t_in, dtype=None, usecols=(0,1), skip_header = minutesOld - 360)
usecols
可以通过设置或通过设置在同一个调用中获取时间和温度数据dtype
;请参阅 genfromtxt示例文档。下面显示的代码说明了前者。此示例的温度记录文件中有大约 1234 行,并且时间没有附加日期。相反,小时数一直超过 24。调整计算文件中行数的代码以匹配您自己的时间表示约定。
from numpy import genfromtxt
from itertools import islice
from time import localtime, time
toKeep = 20
with open('temperature_logging') as fin:
start = genfromtxt(islice(fin,1), dtype=None, usecols=(0,1))
hf, mf = map(int, start.tolist()[0].split(':'))
ti = localtime(time())
hn, mn = ti.tm_hour, ti.tm_min
print 'File start: {:02d}:{:02d}, Time Now: {:02d}:{:02d}'.format(hf, mf, hn, mn)
minutesOld = (hn-hf)*60 + mn-mf
if minutesOld < 0: minutesOld += 24*60
data = genfromtxt(fin, dtype=None, usecols=(0,1), skip_header = minutesOld - toKeep)
print data
以下是上述代码的示例输出:
File start: 03:43, Time Now: 00:16
[('23:57', 66.3) ('23:58', 66.8) ('23:59', 66.7) ('24:00', 67.1)
('24:01', 66.7) ('24:02', 67.1) ('24:03', 66.8) ('24:04', 67.2)
('24:05', 67.4) ('24:06', 67.7) ('24:07', 67.3) ('24:08', 67.1)
('24:09', 66.8) ('24:10', 67.3) ('24:11', 67.8) ('24:12', 67.3)
('24:13', 67.6) ('24:14', 67.6) ('24:15', 67.7) ('24:16', 67.3)]