python - 使用 pytables 选择列子集的最优雅的方法是什么？

Question

我在 pytables 中有一个包含 300 多列的数据集，我希望能够轻松选择不同的子集。似乎没有一个非常优雅的解决方案，或者我缺少什么？

我也很高兴有一种方法可以创建另一个表，该表只是将原始表中的选择列别名化，这样我就可以拥有我的主表，然后是我的子表。有没有办法做到这一点？

score 6 · Accepted Answer

像这样的东西会起作用吗？

from numpy import array, dtype
from h5py import File
from operator import itemgetter

# Dummy data

d = dtype([('a', int),('b', int),('c', int)])
a = array([(1, 6, 4), (5, 7, 1), (9, 7, 8), (3, 1, 2), (2, 1, 6)],dtype=d)

hdf = File('tmp.hdf','a')
hdf.create_dataset('data',data=a)
hdf.flush()

# Extract data

dat = hdf.get('data',default=0)

sub = ['a','c']
get = itemgetter(*sub)

print get(dat)

给，

(array([1, 5, 9, 3, 2]), array([4, 1, 8, 2, 6]))

python - 使用 pytables 选择列子集的最优雅的方法是什么？

1 回答 1

Related

Reference