1

我正在尝试使用 NORB 数据集(http://www.cs.nyu.edu/~ylclab/data/norb-v1.0-small/)做一些工作,但我无法从二进制文件中读取它包含数据集的位置。任何机构都可以提供帮助吗?

我试过numpy.fromfile()但它以错误的方式读取文件。

4

1 回答 1

3

我最近遇到了同样的问题,因为我不得不使用那个数据集,我发现它以一种奇怪的二进制格式分布。

为此,我制作了一个您可能会觉得有用的python 包装器。你可以在这里找到它。

用法很简单:

 dataset = SmallNORBDataset(dataset_root='small_norb_root')

small_norb_root下载和提取数据集文件的文件夹在哪里。所有解析内容都发生在类的初始化中,并且对用户是透明的。初始化后,您可以在:dataset.data['train']dataset.data['test']分别找到您需要的数据。

您还可以使用以下方法探索数据集:

dataset.explore_random_examples(dataset_split='train')

如果一切顺利,输出应如下所示:

在此处输入图像描述

于 2017-12-11T21:23:29.223 回答