我浏览了许多教程,其中我的问题的答案不同。
所以,对于 seq2seq 模型(英语到法语翻译),我有encoder_input_data
没有<start>
和<stop>
标签的英语短语。我对decoder_input_data
and感到困惑decoder_target_data
。
目前,我的数据以一种没有任何结果的方式组织。
decoder_input_data
:包含同时具有<start>
和<stop>
标记的法语短语。decoder_target_data
:包含只有<stop>
标签的法语短语。
谷歌的教训说英语和法语短语都必须在开头和结尾都有标签。另外,我没有得到任何结果。
我应该在解码器的输入中添加
<start>
和<stop>
标记吗?或者,我应该只<start>
在解码器的输入中包含,而在<stop>
解码器的目标中只包含标签吗?为 NMT 放置这些标签的正确方法是什么?