2

当谈到 Autograd 时,我完全是个新手,所以我觉得我做的事情可能很明显是错误的。但是,我花了一整天的时间在这上面挣扎。

我正在尝试计算包含正常 cdf 的函数的导数。我在 Autograd 上没有成功,所以我把它分成越来越小的部分,直到我将错误源隔离为 Normal CDF。这是一个最小的工作示例:

import autograd.numpy as np
from autograd.misc.optimizers import adam, rmsprop, sgd
from autograd import grad
from autograd.scipy.stats import norm

def test_func(x,t):
    return norm.cdf(x)

grad_test = grad(test_func)

def callback(params, t, g):
    print(params, " Gradient: ", g, " Derivative: ", norm.pdf(params))

print(adam(grad_test, 0.0 ,num_iters = 10, step_size= 0.1, callback = callback))

我知道优化 CDF 没有意义,我只是这样做是为了从回调中获取输出,如下所示:

0.0  Gradient:  0.24197072451914337  Derivative:  0.398942280401
-0.09999999586726883  Gradient:  0.26608524890906193  Derivative:  0.396952547641
-0.20013469787000787  Gradient:  0.2897227684832687  Derivative:  0.391032156046
-0.30048876968878535  Gradient:  0.31236074851454854  Derivative:  0.38133185077
-0.40113882898768705  Gradient:  0.33345215596996947  Derivative:  0.368102181121
-0.5021500752550674  Gradient:  0.35244319911051986  Derivative:  0.351686233767
-0.6035729426432459  Gradient:  0.3687944858147128  Derivative:  0.332508890217
-0.7054397817605528  Gradient:  0.38200507149861374  Derivative:  0.311062576619
-0.8077615706004915  Gradient:  0.391638389745137  Derivative:  0.287889684926
-0.910524672771251  Gradient:  0.3973485394632615  Derivative:  0.263562137446

由 Autograd 计算的梯度与由正常 PDF 表示的理论导数不匹配。

我执行不正确吗?我觉得这么广泛使用的包装不太可能有这样的洞。如何使用 Autograd(或 Python 中的其他包)来获得输出标量的函数的有效数值导数。

4

0 回答 0