如何将.txt文件(语料库)读入pytorrch中的torchtext?
我只看到用于示例数据集的 data.Dataset 和用于 csv、json 和 tsv 的 data.TabularData。
https://github.com/pytorch/text#data
https://torchtext.readthedocs.io/en/latest/data.html#dataset
如果我使用这样的表格数据集读取它,它仍然有效:
test_file = data.TabularDataset(path=input_filepath, format='csv', fields=[('text', data.Field())])
但是我的数据集不是表格的,所以我想看看是否有更好的选择。