我知道 GPT 使用 Transformer 解码器,BERT 使用 Transformer 编码器,而 T5 使用 Transformer 编码器-解码器。但是有人能帮我理解为什么 GPT 只使用解码器,BERT 只使用编码器,而 T5 两者都使用吗?
你可以用没有解码器的编码器,没有编码器的解码器,以及编码器和解码器来做什么?
我是 NLP 的新手,所以任何帮助都会很好:D 谢谢!
我知道 GPT 使用 Transformer 解码器,BERT 使用 Transformer 编码器,而 T5 使用 Transformer 编码器-解码器。但是有人能帮我理解为什么 GPT 只使用解码器,BERT 只使用编码器,而 T5 两者都使用吗?
你可以用没有解码器的编码器,没有编码器的解码器,以及编码器和解码器来做什么?
我是 NLP 的新手,所以任何帮助都会很好:D 谢谢!