1

取消了吗?那么如何添加两个数据集来构建词汇?在 allennlp1.0 中,我可以做到

reader = StanfordSentimentTreeBankDatasetReader()
train_dataset = reader.read('train.txt')
dev_dataset = reader.read('dev.txt')

for inst in train_dataset + dev_dataset:
    print(inst)
    break

然后一起建立一个词汇,但是为什么allennlp 2.0取消了呢?很抱歉成为 allennlp 的新人

4

1 回答 1

1

DatasetReader.read()现在只返回一个迭代器。所以你可以像这样完成同样的事情:

from itertools import chain

for inst in chain(train_dataset, dev_dataset):
    print(inst)
于 2021-02-05T17:42:24.360 回答