当谈到 Autograd 时,我完全是个新手,所以我觉得我做的事情可能很明显是错误的。但是,我花了一整天的时间在这上面挣扎。
我正在尝试计算包含正常 cdf 的函数的导数。我在 Autograd 上没有成功,所以我把它分成越来越小的部分,直到我将错误源隔离为 Normal CDF。这是一个最小的工作示例:
import autograd.numpy as np
from autograd.misc.optimizers import adam, rmsprop, sgd
from autograd import grad
from autograd.scipy.stats import norm
def test_func(x,t):
return norm.cdf(x)
grad_test = grad(test_func)
def callback(params, t, g):
print(params, " Gradient: ", g, " Derivative: ", norm.pdf(params))
print(adam(grad_test, 0.0 ,num_iters = 10, step_size= 0.1, callback = callback))
我知道优化 CDF 没有意义,我只是这样做是为了从回调中获取输出,如下所示:
0.0 Gradient: 0.24197072451914337 Derivative: 0.398942280401
-0.09999999586726883 Gradient: 0.26608524890906193 Derivative: 0.396952547641
-0.20013469787000787 Gradient: 0.2897227684832687 Derivative: 0.391032156046
-0.30048876968878535 Gradient: 0.31236074851454854 Derivative: 0.38133185077
-0.40113882898768705 Gradient: 0.33345215596996947 Derivative: 0.368102181121
-0.5021500752550674 Gradient: 0.35244319911051986 Derivative: 0.351686233767
-0.6035729426432459 Gradient: 0.3687944858147128 Derivative: 0.332508890217
-0.7054397817605528 Gradient: 0.38200507149861374 Derivative: 0.311062576619
-0.8077615706004915 Gradient: 0.391638389745137 Derivative: 0.287889684926
-0.910524672771251 Gradient: 0.3973485394632615 Derivative: 0.263562137446
由 Autograd 计算的梯度与由正常 PDF 表示的理论导数不匹配。
我执行不正确吗?我觉得这么广泛使用的包装不太可能有这样的洞。如何使用 Autograd(或 Python 中的其他包)来获得输出标量的函数的有效数值导数。