问题标签 [non-linear-regression]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - r 中具有高多项式交互的回归(大数据)
我正在使用 R 来选择最佳拟合模型的项目。
我有 15 个变量,样本量为 790,000。线性模型不起作用 b/c 残差不是随机的和非正态的。
所以我尝试运行具有更高多项式和交互作用的非线性模型。但是,由于数据集很大,R 非常慢并且不时关闭。
我尝试使用逐步函数 polym 函数,但都不是理想的。是否有用于高阶多项式和交互的函数/包?如果我要编写一个循环,我将如何在不查看绘图的情况下检查每个场景的残差的正态性和随机性?(夏普测试不适用于大样本量)。太感谢了!
更新:fit2b <- lm(f$Assets ~ polym(f$C,f$Suc,f$SP,f$SS, f$Qual_P, f$A, f$TotalAA, f$Eq,f$D, f $PE, f$EI, f$GE, f$EO, degree = 5, raw=TRUE) + f$Gender + f$LT)
fit1b = lm(f$Assets ~ f$A)
步骤(fit1b,范围=列表(上=fit2b,下=~1),方向=“前进”,跟踪=假)
另外,我想知道除了 vif 是否还有其他工具可以检测多重共线性,以及我应该如何调整模型来解决它。
r - nls() 错误收敛(尽管起始值很好)
我一直在研究一个曲线拟合脚本,它将 3 个指数修改的高斯 (EMG) 拟合到一个卷积曲线。我的基函数类似于高斯分布,但包括第三个参数(前两个是mu
和sigma
),它决定了函数的指数分量的权重。
所以总的来说,每个 EMG 峰值需要 3 个参数,加上一个幅度系数(为了匹配实验数据的值 > 1.0)
要对 3 个 EMG 峰值进行反卷积,要最小化的参数总数为 3x4 = 12
在某些情况下,拟合效果很好,但在许多情况下,它无法收敛,并返回这样的错误
仅经过 50 次左右的迭代(远低于限制)。
通过使用跟踪选项,我可以看到结果非常接近匹配数据。通过从我的初始估计值绘制曲线,还可以看出起始参数在合理接近数据的范围内:
数据 = 黑色(添加了噪声),初始 = 橙色,错误前的最终迭代 = 红色
这是我的代码示例,我在其中调用nls()
:
那么,当算法似乎成功时,为什么我会收到错误消息?
r - 计算列表上的高斯曲线拟合
我有一个如下所示的列表数据。我想为 列表中的每个元素在中间值和计数之间执行非线性回归高斯曲线拟合,并报告平均值和标准差
我已经阅读了这篇 在 R 中将密度曲线拟合到直方图, 但这是将曲线拟合到直方图的方法。我想要的是最合适的价值观”
“平均值”“标清”
如果我使用 PRISM 来做,我应该得到以下 A 的结果
执行非线性回归高斯曲线拟合,我得到
对于第二组 B
第三个
我明白了
tensorflow - Tensorflow 的多项式回归中的损失不收敛
我正在尝试在 Tensorflow 中实现多项式回归(二次)。损失没有收敛。谁能帮我解决这个问题。不过,类似的逻辑也适用于线性回归!
r - error fitting function to data using nls
I have some issue using nls()
to estimate parameters. I have a following set of functions to explain some data in hand:
I am trying to fit funk2
to y
:
When I use nls()
:
it shows me following error:
Error in f(x, ...) : object 'l' not found
Isn't the whole point of nls()
to substitute different values for parameters l
and r
from parameter space to fit the function by minimizing SSR and give the parameter estimates? why it needs value of l
for it to work? I am definitely missing something big here. Please help!
Thanks in advance!
r - 使用 optim 来最大化 r 中的可能性的错误
所以,我有这些功能:
用于解释 y 中的数据,
我希望使用 optim 来最大化可能性,所以我定义了一个似然函数:
我尝试使用 optim 来适应
但我收到一个错误:
我不确定为什么?我可以运行 nls 将 funk2(x,l,r) 拟合到 y
这意味着 funk2 正在工作。我想这是我设计的 LL 函数的问题,我无法弄清楚!请帮忙!
matlab - 强制参数在 MATLAB 的非线性拟合中积分
使用lsqcurvefit
MATLAB 中的函数,如何为参数之一强制执行整数类型?所讨论的特定参数是向量的索引,因此只有整数值才有意义;但是,拟合例程可能会在迭代期间尝试参数的任意实数值。
algorithm - 如果使用正态分布的目标值进行训练,非线性回归算法会表现得更好吗?
在找出可以应用于数据集的目标值(y 列)的许多转换之后,例如 box-cox 转换,我了解到线性回归模型需要使用正态分布的目标值进行训练才能提高效率.(https://stats.stackexchange.com/questions/298/in-linear-regression-when-is-it-appropriate-to-use-the-log-of-an-independent-va)
我想知道这是否同样适用于非线性回归算法。目前,我已经看到 kaggle 上的人们通过使用 xgboost 使用对数转换来减轻异方差性,但他们从未提及是否也这样做是为了获得正态分布的目标值。
我试图做一些研究,我在第 11 页的 Andrew Ng 的讲义(http://cs229.stanford.edu/notes/cs229-notes1.pdf)中发现最小二乘成本函数,被许多算法线性使用和非线性,是通过假设误差的正态分布得出的。我相信如果误差应该是正态分布的,那么目标值也应该是正态分布的。如果这是真的,那么所有使用最小二乘成本函数的回归算法应该更好地处理正态分布的目标值。
由于 xgboost 使用最小二乘成本函数进行节点拆分(http://cilvr.cs.nyu.edu/diglib/lsml/lecture03-trees-boosting.pdf - slide 13)那么如果我转换目标,这个算法可能会更好使用 box-cox 变换来训练模型的值,然后在输出上应用逆 box-cox 变换以获得预测值。从理论上讲,这会产生更好的结果吗?
python - 如何使用 python 中的 mord 模块进行序数回归?
我正在尝试根据一些特征预测标签,并且我有一些训练数据。
在 python 中搜索序数回归,我找到了http://pythonhosted.org/mord/但我不知道如何使用它。
如果有人有一个示例代码来演示如何使用这个模块,那就太好了。以下是 mord 模块中的类: