问题标签 [function-approximation]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 在 Python 中计算梯度偏导数时溢出
我在 python 中创建了一个 def 函数,我可以在没有激活函数的非常基本的函数逼近神经网络中做简单的梯度偏导数来更新变量。这是针对尝试估计输出 y 的单个输入 x1。
我也有一个标准化的 def 函数,当我运行我的代码但首先标准化输入数据集时,我没有遇到任何问题。当我通过相同的梯度偏导函数运行原始数据集时,当我对变量 m 和 b 进行更新时,精度立即变得很大,并且出现溢出问题。
有谁知道我该如何解决这个问题?由于变量 m 和 b 的更新,我已经能够弄清楚它的发生情况,这些变量会循环回到 y 中。但我不确定如何解决这个问题?通过一些快速的谷歌搜索,我没有看到任何解决方案,然后人们说溢出是一个问题,即您的数字的精度超过了您使用的数据类型的限制。如何阻止溢出发生?
python - np.sum 不返回精确的总和
考虑以下数字的 numpy 向量:
显然,这些数字的总和为 1。但是,当计算
我明白了
你能解释一下为什么以及如何解决这个近似问题吗?
r - RStudio 中用于逼近三角函数的算法是什么?
我已经在 RStudio 上尝试了以下代码,并期望出现 0、1 和 0.5。但是,它显示了一个非常小的数字而不是 0,我认为它必须使用某种算法来近似 sin 函数。
这是结果
我想知道在这种情况下他们是如何逼近 sin 函数的。
sympy - python中的多项式插值
我正在研究函数逼近,在尝试理解/实现多项式插值时,我在这里找到了一个示例。我发现下面的代码是一个很好的例子来理解实际发生的事情,而不是使用准备好的函数,但是它没有运行:
定义插值算法。本质上,我们试图将真实 f 表示为基函数 (psi-s) 的线性组合。
真函数 f:= 10(x-1)^2 -1,节点:x0:= 1 + 1/3 和 x1 = 1 + 2/3。间隔:[1,2]。
代码不运行。错误发生在行
错误消息:ValueError: (2, 2) is not an integer
但是 A 不应该是整数,它是一个方阵,其每个元素在每个节点上都经过 psi 评估。f = A*c。
谢谢!!!
reinforcement-learning - Policy Gradient 与函数逼近的收敛保证
是否有任何具有“一般”值/Q 函数逼近的策略梯度算法的收敛证明?开创性论文 (Sutton1999 & Tsitsiklis1999) 使用兼容性假设证明了该定理(即 Q 函数近似与策略特征是线性的)。此外,后来的改进如 DPG(Silver14)也有类似的假设。
然而在实践中,不满足这种兼容性假设,策略网络和 Q 功能网络有自己的、独立的参数集。
因此,我想知道这些方法在多大程度上得到了理论保证的支持。
谢谢,
(Sutton1999):使用函数近似进行强化学习的策略梯度方法,Sutton 等人,1999 (Silver2014):确定性策略梯度算法,Silver 等人,2014 (Tsitsiklis1999):Actor-Critic 算法,Tsitsiklis 等人,1999
c - 如何使用其泰勒级数逼近双曲正弦?
编辑(已解决):错误在阶乘中,这是正确的解决方案:
如果您想要更好的近似值,请更改迭代次数。但是为了这个练习,21 次迭代给出了一个很好的近似值,但是当结果不再改变时,可以更新它以结束循环。您可以将上一个结果存储在 old_result 中,并将下一个结果存储在 new_result 中;如果 old_result 等于 new_result,则循环结束。
我正在尝试近似双曲正弦。我需要在不使用 math.h 库函数的情况下做到这一点。
[不要给我完整的解决方案,只是一些提示,因为我需要自己弄清楚]
这就是我所做的:
给定双曲正弦泰勒级数,我需要计算 (2*n + 1) 的阶乘。为此,我只需要执行此步骤:
我需要计算 x^(2*n +1) 的幂,我是这样做的:
现在,我拥有了每一件,泰勒系列的实现如下:
tensorflow - Tensorflow2 到 Tensorflow1
我在 tensorflow2 中实现了一个函数 aproximator(有效)。但是,我没有意识到我应该在 tensorflow 1.14 中实现它。所以,现在我正处于十字路口,因为版本完全不同,我找不到像 Tensorflow2 官方教程那样详细的教程。
我想知道是否有人可以帮助我翻译这个非常简单的示例和/或为我指明一个好的详细教程的方向。
'''
'''
谢谢