请阅读给定的问题。
您需要使用原始cats_vs_dogs 数据的子集,这些数据完全在“train”拆分中。IE 'train' 包含 25000 条记录和 1738 张损坏的图像,总共有 23262 张图像。
你会把它分开得到
- 前 10% 作为“新”训练集
- 最后 10% 作为新的验证集和测试集,从中间分开(即最后 10% 的前半部分是验证集(前 5%),后半部分是测试集(后 5%))
这 3 个记录集应分别称为 train_examples、validation_examples 和 test_examples。
注意:记得使用cats_vs_dogs:4。. 作为数据集,因为 4.0 支持新的拆分 API。
我为相应的代码编写了代码如下:
splits = ['train[:10%]', 'train[-10% :-5%]', 'train[-5%:]']
splits, info = tfds.load('cats_vs_dogs:4.*.*', split=splits, data_dir=filePath, with_info=True)
(train_examples, validation_examples, test_examples) = splits
train_len = len(list(train_examples))
validation_len = len(list(validation_examples))
test_len = len(list(test_examples))
print(train_len)
print(validation_len)
print(test_len)
我运行上面的代码并得到以下错误。
AssertionError: Unrecognized instruction format: train[-10% :-5%]
请帮助我进行适当的拆分。