所以我将随机化窗口设置为 100,000。在我的日志中,我可以看到它在 0 个错误和很多错误之间摇摆不定,这让我怀疑数据是否真的是随机的。训练数据由序列组成,其中输入通常是大约 50 个标记,输出是大约 99% 的序列的 6 个标记,另外 1% 中可能有大约 400 个标记(这些序列是最重要的学习如何输出,当然)。似乎不止一个较长的序列可能会聚集在一起,这就是错误率可能突然上升的原因。那可能吗?
问问题
65 次
所以我将随机化窗口设置为 100,000。在我的日志中,我可以看到它在 0 个错误和很多错误之间摇摆不定,这让我怀疑数据是否真的是随机的。训练数据由序列组成,其中输入通常是大约 50 个标记,输出是大约 99% 的序列的 6 个标记,另外 1% 中可能有大约 400 个标记(这些序列是最重要的学习如何输出,当然)。似乎不止一个较长的序列可能会聚集在一起,这就是错误率可能突然上升的原因。那可能吗?