问题标签 [optimizer-deeplearning]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

3 问题

0 投票

0 回答

48 浏览

machine-learning - 无法建立 arxiv 论文中提到的深度学习模型

我正在尝试使用相同的数据集复制这篇论文。但不知何故，他们训练并获得了（80%）比我通常（65%）更好的准确率。我的数据不平衡 300:500（填充词：非填充词）。该模型倾向于在前几个时期过拟合。

该模型

我尝试过的更新：

将 RMSprop 等优化器更改为 adam 和 SGD 并没有帮助。

学习率的变化没有帮助。

模型

2020-08-13T03:54:15.517

0 投票

1 回答

317 浏览

python - tensorflow 2.2.0 中的量化感知训练产生更高的推理时间

我正在使用 MobilenetV2 对个人数据集进行迁移学习的量化。我尝试过两种方法：

i.) 仅训练后量化：它工作正常，并且在 224,224 维上推理 60 幅图像的平均时间为 0.04 秒。

ii.) 量化感知训练 + 训练后量化：它比仅训练后量化产生更高的准确性，但对于相同的 60 张图像产生 0.55 秒的更高推理时间。

1.) 只有训练后量化模型（.tflite）可以通过以下方式推断：

2.) 量化感知训练+训练后量化可以通过以下代码推断。不同之处在于它在这里要求 float32 输入。

我进行了很多搜索，但没有得到任何关于此查询的回复。如果可能的话，请帮助解释为什么在量化感知训练+训练后量化的情况下，与仅训练后量化相比，我的推理时间会变高？

python computer-vision tensorflow2.0 quantization-aware-training optimizer-deeplearning

2020-09-09T06:22:00.770

0 投票

1 回答

57 浏览

deep-learning - 反向传播是否使用优化函数来更新权重？

我知道反向传播计算成本函数相对于模型参数（权重和偏差）的导数。但是，我需要确保反向传播不会更新权重和偏差；相反，它使用优化器来更新权重和偏差，如 Adam、梯度下降等

提前致谢

deep-learning backpropagation optimizer-deeplearning

2020-10-29T08:54:44.500

1 2 3 4 5 6 7 8 9 10

问题标签 [optimizer-deeplearning]

machine-learning - 无法建立 arxiv 论文中提到的深度学习模型

python - tensorflow 2.2.0 中的量化感知训练产生更高的推理时间

deep-learning - 反向传播是否使用优化函数来更新权重？

Reference