python - 是否可以查看 pytorchtext.data.Tabulardataset 的读取数据？

Question

train, test = data.TabularDataset.splits(path="./data/", train="train.csv",test="test.csv",format="csv",fields=[("Tweet",TEXT), ("Affect Dimension",LABEL)])

我有这段代码并想评估加载的数据是否正确，或者它是否为实际文本字段使用了错误的列等。

如果我的文件有“Tweet”列作为文本，“Affect Dimension”作为类名，那么将它们放在字段部分是否正确？

编辑：TabularDataset 包括一个示例对象，可以在其中读取数据。读取 csv 文件时，仅接受“，”作为分隔符。其他一切都会导致数据损坏。

score 1 · Accepted Answer

无论您的文件有什么，您都可以放置任何字段名称。另外，我建议不要在字段名称中使用空格。

所以，重命名Affect Dimension或Affect_Dimension任何方便你的东西。

然后您可以遍历不同的字段，如下所示以检查读取的数据。

for i in train.Tweet:
    print i
for i in train.Affect_Dimension:
    print i

for i in test.Tweet:
    print i
for i in test.Affect_Dimension:
    print i

python - 是否可以查看 pytorchtext.data.Tabulardataset 的读取数据？

1 回答 1

Related

Reference