我正在尝试使用 NORB 数据集(http://www.cs.nyu.edu/~ylclab/data/norb-v1.0-small/)做一些工作,但我无法从二进制文件中读取它包含数据集的位置。任何机构都可以提供帮助吗?
我试过numpy.fromfile()
但它以错误的方式读取文件。
我正在尝试使用 NORB 数据集(http://www.cs.nyu.edu/~ylclab/data/norb-v1.0-small/)做一些工作,但我无法从二进制文件中读取它包含数据集的位置。任何机构都可以提供帮助吗?
我试过numpy.fromfile()
但它以错误的方式读取文件。
我最近遇到了同样的问题,因为我不得不使用那个数据集,我发现它以一种奇怪的二进制格式分布。
为此,我制作了一个您可能会觉得有用的python 包装器。你可以在这里找到它。
用法很简单:
dataset = SmallNORBDataset(dataset_root='small_norb_root')
small_norb_root
下载和提取数据集文件的文件夹在哪里。所有解析内容都发生在类的初始化中,并且对用户是透明的。初始化后,您可以在:dataset.data['train']
或dataset.data['test']
分别找到您需要的数据。
您还可以使用以下方法探索数据集:
dataset.explore_random_examples(dataset_split='train')
如果一切顺利,输出应如下所示: