我经常遇到的一件常见事情是我的模型将包含具有 NaN 值的矩阵。是否有一种通用的 Flux 方法可以将我的矩阵传入并检测这些 NaN?我知道 Julia 有一个内置isnan()
函数,可以在某些情况下使用,但我不确定是否有特定于 Flux 的版本?
问问题
79 次
1 回答
1
不,没有特定于通量的功能。在大多数情况下,使用any(isnan, A)
可能是您想要做的。一种与 Flux 相关的“增强”是在检测到 NaN 时使用训练循环回调来停止训练。
# assumes (x, y) is your training data
# and loss(x, y, mode) will compute the loss of model on (x, y)
cb = () -> isnan(loss(x, y, model)) && Flux.stop()
# basic train loop
# assuming opt is your optimizer
Flux.train!((x, y) -> loss(x, y, model), params(model), [(x, y)], opt; cb = cb)
上面的示例是基本思想,您可以扩展为检查不同数组的 NaN。例如,你可以做
cb = () -> any(params(m)) do p
any(isnan, p)
end && Flux.stop()
检查是否有任何参数为 NaN。
于 2021-07-05T22:43:48.220 回答