0

我想问你一些关于torchtext的问题。

我有一个关于抽象文本摘要的任务,我用 pytorch 构建了一个 seq2seq 模型。

我只是想知道torchtext中build_vocab函数构造的data_field。

在机器翻译中,我接受需要两个 data_fields(input, output)。

但是,总而言之,输入数据和输出数据是相同的语言。

在这里,我应该在这里创建两个 data_field(full_sentence, abstract_sentence) 吗?

还是可以只使用一个data_field?

恐怕我的错误选择会使模型的性能下降。

请给我一个提示。

4

1 回答 1

0

在总结和其他任务的情况下你是对的,为输入和输出构建和使用相同的词汇是有意义的

于 2019-09-14T14:52:04.193 回答