pytorch - torchtext 数据 build_vocab / data_field

Question

我想问你一些关于torchtext的问题。

我有一个关于抽象文本摘要的任务，我用 pytorch 构建了一个 seq2seq 模型。

我只是想知道torchtext中build_vocab函数构造的data_field。

在机器翻译中，我接受需要两个 data_fields(input, output)。

但是，总而言之，输入数据和输出数据是相同的语言。

在这里，我应该在这里创建两个 data_field(full_sentence, abstract_sentence) 吗？

还是可以只使用一个data_field？

恐怕我的错误选择会使模型的性能下降。

请给我一个提示。

score 0 · Accepted Answer

在总结和其他任务的情况下你是对的，为输入和输出构建和使用相同的词汇是有意义的

1 回答 1