我浏览了许多教程,其中我的问题的答案不同。
所以,对于 seq2seq 模型(英语到法语翻译),我有encoder_input_data没有<start>和<stop>标签的英语短语。我对decoder_input_dataand感到困惑decoder_target_data。
目前,我的数据以一种没有任何结果的方式组织。
decoder_input_data:包含同时具有<start>和<stop>标记的法语短语。decoder_target_data:包含只有<stop>标签的法语短语。
谷歌的教训说英语和法语短语都必须在开头和结尾都有标签。另外,我没有得到任何结果。
我应该在解码器的输入中添加
<start>和<stop>标记吗?或者,我应该只<start>在解码器的输入中包含,而在<stop>解码器的目标中只包含标签吗?为 NMT 放置这些标签的正确方法是什么?

