1

我一直在尝试在带有 scala 的 TransE 上使用 BigDL 库中的优化器(SGD,Adagrad)。我当前的实现以顺序方式使用小批量。我按照这个例子优化了嵌入(作为张量)而不创建分层模型。我的代码有点类似于这个例子。我目前的问题是,无论我运行多少个时期,我的损失都会达到一个平稳点(保证金的价值)。有了这个,我在测试中的 hit@10 并不是那么好。有人能给出任何想法,为什么损失会达到一个平稳点,如果这会产生糟糕的测试结果?PS我检查了我的损失计算,这很好。我唯一可以控制我的实现的地方是优化器。

提前致谢。

4

0 回答 0