我正在使用 pytorch 中的 RNN 进行文本分类任务。我有一个训练数据集和测试数据集。对于我的任务,我需要使用训练数据集的前 1000 个实例来训练我的模型。我可以使用前 1000 个训练实例创建 TabularDataset 吗?
我想为前 1000 个实例创建一个 tabularDataset。有什么办法吗?
下面,我使用整个训练和测试数据创建了一个表格数据集。
train_data, test_data = TabularDataset.splits(
path='cola_public/for_torch_text', train='in_domain_train.tsv',
path='/content/drive/MyDrive', train='/content/drive/MyDrive/axcs_train.csv',
test='/content/drive/MyDrive/axcs_test.csv', format='csv',skip_header=True,
fields=tv_datafields)