问题标签 [sgd]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
424 浏览

python - SGD算法从零开始预测电影评分

基于这个等式,我必须计算我在下面所做的 wrt b 的导数

优化方程 优化方程

但对于查询

我应该得到答案 = -0.931
,但我得到了一个巨大的数字。
我应该在我的功能中进行哪些更正?

0 投票
0 回答
67 浏览

pytorch - 如何使用 PyTorch 的预训练模型理解训练损失的周期性?

我正在使用来自 Pytorch (Resnet 18,34,50) 的预训练模型来对图像进行分类。在训练过程中,训练中出现了一个奇怪的周期性,如下图所示。有人已经有类似的问题了吗?为了处理过度拟合,我在预处理中使用了数据增强。当使用 SGD 作为具有以下参数的优化器时,我们获得了这种图:

  • 标准:NLLoss()
  • 学习率:0.0001
  • 时代:40
  • 每 40 次迭代打印一次

SGD 训练与验证损失

我们还尝试将 adam 和 Adam bound 作为优化器,但观察到相同的周期性。

提前感谢您的回答!

这是代码:

0 投票
1 回答
141 浏览

python - 为什么在这种情况下我需要使用 ravel() ?

我真的很困惑为什么在将数据拟合到 SGDRegressor 之前需要使用 ravel()。

这是代码:

这些是 X 和 y 的形状:

0 投票
0 回答
47 浏览

tensorflow - 如何使用随机梯度下降学习归一化流

我最近正在实施如https://arxiv.org/abs/2102.07501中所述的退火流传输方法。在某一时刻,任务是通过使用 SGD 学习归一化流来最小化给定的损失函数。我研究了很多关于这个问题带来的几个主题的论文,但无法弄清楚如何将这些想法联系起来。所以,问题来了:

假设给定分布 p 的样本 (x_1,...,x_N)。我们现在想学习一个规范化流 T,它传输每个粒子,使得 (T(x_1),...,T(x_N)) 是目标分布 q 的适当样本。正如已经提到的来源中所述,这是通过最小化 T(p) 和 q 的 Kullback-Leibler-Divergence 来完成的。由此产生的损失函数(我们想要最小化的那个)被标记为 L 或 L(T)。

作者非常详细地描述了他们的算法,但此时他们只是说“使用 SGD 学习 T 以最小化 L”。

我的意图是使用 TensorFlow 和 Keras,使用 L 作为自定义损失函数,并且 - 正如作者建议的那样 - Adam 优化器,但是,就目前而言,这是我的代码:

我将不胜感激任何建议,因为我对现有代码的搜索没有成功。

非常感谢,克里斯蒂安

0 投票
0 回答
74 浏览

python - 训练中爆炸性的损失值

我试图复制这篇论文。我使用带有学习率函数的 SGDW:

lr = base_lr * (1 + gamma * iter)^(-power)

我的自定义时间表:

我的优化器:

然而,损失和平均绝对误差在 30 个 epoch 后呈爆炸式增长。这是训练过程的图表Learning Rate on epochTrain and Validation Loss on epochTrain and Validation MAE on Epoch。这里一定有什么问题。我尝试了不同的优化器和调度器,一切都很好。

0 投票
0 回答
17 浏览

python - 随机梯度体面算法的值误差

我无法运行我的 SGD 代码,也不知道问题出在哪里。如果你能帮助我,那就太好了。这是我的代码:

我称这个函数为:

但是出现值错误:

ValueError:发现样本数量不一致的输入变量:[1151, 2]

f1尺寸问题ceodef stochastic_gradient_descent(self). 但我不知道如何解决这个问题。你能给我一些提示吗?

0 投票
1 回答
369 浏览

python - 无法解释 Keras 中的优化器标识符 SGD

我试图替换这个

但这仍然不起作用

这是我的代码

这是错误:

0 投票
0 回答
25 浏览

deep-learning - PyTorch:了解 Adam 的实现

我查阅了 PyTorch 的 Adam 源代码,并意识到核心部分是以下代码:

现在,我想看看F.adam()是如何实现的,但我不太清楚在哪里可以找到F. 一开始,它说:from . import _functional as F,我也不太清楚这是指什么。

帮助将不胜感激。

0 投票
1 回答
1126 浏览

python - Anaconda:ValueError:无法解释优化器标识符

我尝试运行此代码:

我得到这个错误:

之前在尝试用python学习keras的时候没有遇到这个问题,但是后来又遇到了其他的错误。在我更新了所有插件并重新安装了anaconda3之后,我遇到了这个问题。

我参考查到的信息改了代码内容,之后没有报错。

但是后来我遇到了以下错误:

以上2个问题是否与连通性有关?的错误在哪里from keras.optimizers import SGDmodel.compile(loss='mse', optimizer=SGD(lr=0.1),metrics=['accuracy'])我应该如何修改它?

请知道的前辈帮忙指出问题和解决方法,谢谢。

0 投票
0 回答
34 浏览

python-3.x - pytorch 中的手写优化器不起作用

我已经尝试根据该算法编写优化器: 算法 文章,我从中获取了算法(第 5 页):https ://arxiv.org/pdf/2106.02720.pdf

但我的解决方案不是优化任何东西。当我试图修复它时,我发现 d_p 仅由零组成,但我不明白为什么(

帮助我,我是优化新手,我可能在代码中犯了很多错误(