我有一个大约 1.5 亿点的时间序列。我需要放大 300 万个点。也就是说,我需要在这 1.5 亿点时间序列中提取围绕这 300 万个感兴趣区域中的每一个的 100 个时间点。
试图:
def get_waveforms(data,spiketimes,lookback=100,lookahead=100):
answer = zeros((len(spiketimes),(lookback+lookahead)))
duration = len(data)
for i in xrange(len(spiketimes)):
if(spiketimes[i] - lookback) > 0 and spiketimes[i] + lookahead) < duration:
answer[i,:] = data[(spiketimes[i]-lookback):(spiketimes[i]+lookahead)]
return answer
这会耗尽我 Mac 上的所有可用内存。如果我尝试传递 where 数组,它会爆炸len(array) > 100000
。是否有更高效的内存或(希望)更优雅的方法来根据另一个数组提取一个数组的一部分?
相关 这个答案是相关的。但是,我不确定如何应用它并避免循环。我会有效地用布尔矩阵的列一遍又一遍地索引时间序列向量吗?