Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
构建不跨越句子边界的循环语言模型(例如 LSTM)的最佳方法是什么?或者更笼统地说,如果你给模型呈现一个批次,每行包含多个句子,你如何在看到每个句子后重置状态?您可以为模型指定一个特殊的令牌吗?
谢谢!
如果句子是独立的,让批次中的每一行只包含一个句子会更清晰。然后,您可以在每批之后重置 LSTM 的状态,如该问题的答案中所述。