问题标签 [relu]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

89 问题

0 投票

1 回答

193 浏览

neural-network - XOR 与 ReLU 激活函数

如果我尝试使用 sigmoid 函数，它可以正常工作，但是当实现 ReLU 激活函数时，程序不会学习任何东西。

NN 由 3 个输入层、隐藏层和输出层组成，并为输出函数实现了 sigmoid 激活函数。手工计算似乎很好，但找不到缺陷。

下面带有 sigmoid 激活函数的代码工作得很好。

2021-06-16T05:42:16.687

0 投票

1 回答

47 浏览

python - ReLU 不一致/随机行为

我写了一个简单的 nn（它应该添加两个数字）并且我尝试了不同的激活函数，这是我的代码

这是主要的

我有两个问题：-

当使用 learning_rate = 0.1 的 ReLU 以外的激活时，需要超过 100,000 个 epoch 才能获得接近于零的一些错误，但仍然没有达到 0，但它是一致的并且错误总是下降，所以首先要问为什么它需要太多的 epochs在使用 Sigmoid 或 Tanh 时解决像添加两个数字这样的简单任务？
使用 ReLU 时，错误可能会非常快地变为 0，可能在 5000 个 epoch 左右，但问题是这不一致，有时错误永远不会下降，所以为什么会发生这种情况（我认为问题出在权重初始化但我是不确定）以及为什么与使用其他激活函数时相比，它在工作时会使错误快速变为 0。

python machine-learning neural-network activation-function relu

2021-06-17T18:23:51.097

0 投票

0 回答

144 浏览

tensorflow - 双漏 relu (自定义激活函数) (tf 2.5.0)

我正在尝试创建一个泄漏的 relu，它对于值 > 1 的梯度与对于值 < 0 的梯度相同。

我有一个似乎可以工作的实现，但它比正常的泄漏 relu 慢约 50%。所以我认为必须有更好的方法。

这是一个最小的例子：

我已经在互联网上搜索了几个小时，但我还没有找到一个简单或明确的解决方案。我知道标准 tf.keras.layers.ReLU 支持 max_value ，我可以将其设置为 1 但我试图避免这种情况以避免垂死的 relu 问题。

我希望有人可以帮助我或指出我正确的方向。

tensorflow keras optimization activation-function relu

2021-06-23T17:49:20.770

0 投票

1 回答

351 浏览

python - 输入必须有 3 个维度，在创建 LSTM 分类器时出现 2 个错误

网络的结构必须如下：

(lstm): LSTM(1, 64, batch_first=True)

（fc1）：线性（in_features=64，out_features=32，bias=True）

(relu): ReLU()

(fc2)：线性（in_features=32，out_features=5，bias=True）

我写了这段代码：

这是为了测试：

错误是：

----> 3 输出 = 模型 (batch_data.to(device)).cpu()

5 帧 /usr/local/lib/python3.7/dist-packages/torch/nn/modules/rnn.py in check_input(self, input, batch_sizes) 201 raise RuntimeError( 202 'input must have {} dimensions, got { }'.format(--> 203 expected_input_dim, input.dim())) 204 if self.input_size != input.size(-1): 205 raise RuntimeError(

RuntimeError：输入必须有 3 个维度，得到 2

我的问题是什么？

python tensorflow machine-learning lstm relu

2021-07-02T19:27:48.040

0 投票

2 回答

266 浏览