0

我执行 sigmoid 效果很好,但 sigmoidDerivative 给出的结果与 nd4j 中的 sigmoid 相同。Transforms.sigmoidDerivative(x)和 和有什么不一样Transforms.sigmoidDerivative(x, true)

INDArray x = Nd4j.create(new double[] { 0.1812, 0.1235, 0.8466 });
System.out.println(x);
System.out.println(Transforms.sigmoid(x));
System.out.println(Transforms.sigmoidDerivative(x));
System.out.println(Transforms.sigmoidDerivative(x, true));

给出输出:

[[    0.1812,    0.1235,    0.8466]]
[[    0.5452,    0.5308,    0.6999]]
[[    0.5452,    0.5308,    0.6999]]
[[    0.2480,    0.2490,    0.2101]]

与 python 的 numpy 比较:

>>> def sigmoid(x):
...     return 1.0 / (1 + np.exp(-x))
... 
>>> def sigmoid_derivative(x):
...     a = sigmoid(x)
...     return a * (1.0 - a)

>>> x = np.array([    0.1812,    0.1235,    0.8466])
>>> sigmoid(x)
array([0.54517646, 0.53083582, 0.69985343])
>>> sigmoid_derivative(x)
array([0.24795909, 0.24904915, 0.21005861])

Nd4j pom:

<dependency>
     <groupId>org.nd4j</groupId>
     <artifactId>nd4j-native-platform</artifactId>
     <version>1.0.0-beta3</version>
</dependency>
4

1 回答 1

1

你是对的,两者都Transforms.sigmoidDerivative(x)应该Transforms.sigmoidDerivative(x, true)给出相同的结果,这是 dl4j 中的一个错误。正确的行为有后一种方法。我已经提交了一个拉取请求来解决它。

于 2019-01-19T08:10:24.717 回答