我们都知道包中包含的常见 MNIST 数据集torchvision.datasets
。想象一下,我想创建一个仅包含1和0的数据集的简化版本,以仅对这两个数字进行分类,而不是对所有 10 个值进行分类。
我已经看到可以在继承所需数据集 so 的类中创建自定义数据集__getitem__
,它返回给定索引处的项目。所以我这样做了:
class MNIST01(MNIST):
def __getitem__(self, idx):
image, label = super().__getitem__(idx)
if label.item() <= 1:
return image, label
else:
return None
问题是我似乎无法返回 None 值,因为它需要“包含张量、数字、字典或列表;找到类‘NoneType’”。
有没有一种简单的方法可以以类似的方式轻松获得此数据集的简化版本?