0

我有一个 2GB 的 vcf DNA 文件,我正在尝试使用 vcf_to_zarr() 打印出具有所有固定字段的所有变体,但我收到错误 KeyError: 'variants/*'

allel.vcf_to_zarr

import allel
import numcodecs
import zarr

def readVcf():

    allel.vcf_to_zarr('actual.vcf', 'example.zarr', fields='*', overwrite=True)
    callset = zarr.open_group('example.zarr', mode='r')
    allfield=callset['variants/*']

    for a in allfield:
         print(a)

4

1 回答 1

0

要遍历所有变体字段,请执行以下操作:

for a in callset['variants']:
    print(a)

Zarr 不理解层次结构路径中的通配符 ('*')。

于 2019-09-24T10:46:11.930 回答