1

我正在学习 seq2seq 神经模型,我对常规的 softmax 和采样的 softmax 感到困惑。有人告诉我,采样的 softmax 主要用于大词汇量。那么任何人都可以直观地解释两者之间的区别吗?

4

0 回答 0