我正在尝试为 h5 数据集实现一个可迭代的类。
class Argh():
def __init__(self, data):
self.data = data
self.c_idx = 0
def __getitem__(self, idx):
return self.data[idx]
def __len__(self):
return len(self.data)
def __next__(self):
try:
x = self.data[self.c_idx]
except IndexError or ValueError:
raise StopIteration
self.c_idx += 1
return x
def __iter__(self):
return self
当我尝试按照顺序通过它时,它无法在之前或发生之前引发StopIteration
异常。如果我只是直接遍历 h5 数据集,或者我通过索引和 getitem 使用迭代,则不会发生这种情况:ValueError
IndexError
with h5py.File('test.h5', 'w') as f:
f.create_dataset(name='matrix', data=np.arange(10), dtype=np.float32)
f = h5py.File('test.h5', 'r')
A = Argh(np.arange(0,10))
B = Argh(f['matrix'])
for x in A: pass
for x in B.data: pass
for i in range(len(B)): B[i]
for x in f['matrix']: pass
for x in B: pass
ValueError Traceback (most recent call last)
<ipython-input-7-1dcb814e7a79> in <module>
3 for i in range(len(B)): B[i]
4 for x in f['matrix']: pass
----> 5 for x in B: pass
ValueError: Index (10) out of range (0-9)
zarr
我已经在包括数组在内的其他几个对象上对此进行了测试,但仅在h5py
打开的 h5 数据集上观察到了这种行为。