很清楚如何训练编码器-解码器模型进行翻译:每个源序列都有其对应的目标序列(翻译)。但在文本摘要的情况下,摘要比其文章短得多。根据Urvashi Khandelwal 的说法,神经文本摘要每个源句子都有其摘要(更短或更长)。但我几乎不相信存在任何这样的数据集,其中每个句子都有相应的摘要。那么,如果我是对的,训练sunch模型的可能方法是什么?否则是否有任何免费的文本摘要数据集?
很清楚如何训练编码器-解码器模型进行翻译:每个源序列都有其对应的目标序列(翻译)。但在文本摘要的情况下,摘要比其文章短得多。根据Urvashi Khandelwal 的说法,神经文本摘要每个源句子都有其摘要(更短或更长)。但我几乎不相信存在任何这样的数据集,其中每个句子都有相应的摘要。那么,如果我是对的,训练sunch模型的可能方法是什么?否则是否有任何免费的文本摘要数据集?