问题标签 [linear-regression]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
equation - 2 变量线性回归方程
我们正在使用一种没有线性回归函数的编程语言。我们已经实现了一个单变量线性方程:
y = Ax + B
并使用类似于此 Stack Overflow 答案的解决方案从数据中简单地计算了 A 和 B 系数。
我知道随着变量的添加,这个问题在几何上变得更加困难,但为了我们的目的,我们只需要再添加一个:
z = Ax + By + C
在给定 x、y 和 z 的数组的情况下,有没有人有封闭形式的方程或任何语言的代码可以求解 A、B 和 C?
gnuplot - 使用 Gnuplot 进行时间序列的线性回归
我是 Gnuplot 的忠实粉丝,我在学习期间一直将它用于各种项目。
最近我想用 Gnuplot 来绘制一些时间序列图,比如减肥、锻炼结果、气体消耗等。
因此,我像缩放 x 轴一样
现在我想使用拟合函数给我一个线性拟合。我的问题是,如果 x 轴与时间相关,我无法让它工作。
math - 我可以强制三向线性回归中的两个分量为正吗?
如果我没有使用正确的数学术语,我很抱歉,但我希望你能理解我想要完成的事情。
我的问题:我对来自两个向量 x 和 y 的值针对结果 z 使用线性回归(目前是最小二乘法)。这将在 matlab 中完成,我正在使用 \-operator 执行回归。我的数据集将包含几千个观察值(最多约 50000 个)。
x 值将在 10-300 范围内(大多数在 60 和 100 之间),y 值在 1-3 范围内。
我的代码如下所示:
输出“参数”是该公式中使用的三个因子 a0、a1 和 a2:
(我应该是下标的)
尽管我希望 a1 和 a2 这两个参数始终为正值,但即使向量 z 为负数(这意味着 a0 当然是负数),这也可以正常工作,因为这是真实模型的样子(z 总是与 x 和 z 正相关)。这可以使用最小二乘法吗?我也对其他线性回归算法持开放态度。
testing - 如何计算假设检验中的 p 值(线性回归)
目前我正在编写一个awk
脚本来对测量数据进行一些统计分析。我正在使用线性回归来获取参数估计值、标准误差等,并且还想计算零假设检验(t 检验)的 p 值。
到目前为止,这是我的脚本,知道如何计算 p 值吗?
c++ - 找到“最干净”数据子集的方法,即具有最低可变性的子集
我试图在几个数据集中找到一个趋势。趋势涉及找到最佳拟合线,但如果我认为该过程对于任何其他模型都不会太不同(可能更耗时)。
有3种可能的场景:
- 所有数据都符合单一趋势且可变性低的所有良好数据
- 所有或大部分数据表现出巨大可变性并且必须丢弃整个数据集的所有不良数据。
- 部分好数据,其中一些数据可能很好,而其余数据需要丢弃。
如果具有极端可变性的数据的净百分比太高,则必须丢弃整个数据集。这意味着基本上只有这种类型的数据,并且不良数据的百分比各不相同:
0% 坏 = 案例 1
100% 坏 = 案例 2我只寻找低可变性的连续部分;即我不在乎是否有一些符合趋势的个别点
我正在寻找的是一种对数据集进行分段并搜索指定趋势的智能方法。由于问题的性质,我不是在寻找最适合整体趋势的部分。我知道具有“更清洁”数据的小节最终将具有与整体(包含异常值)略有不同的趋势线属性。这正是我想要的,因为这部分数据最能反映实际趋势。
我精通 C++,但由于我试图使代码开源和跨平台,所以我坚持 ISO C++ 标准。这意味着没有 .NET,但如果您有 .NET 示例,如果您还可以帮助我将其转换为 ISO C++,我将不胜感激。我也有 JAVA、一些汇编和 fortran 的知识。
数据集本身并不庞大,但大约有 1.5 亿个,因此蛮力可能不是最好的方法。
提前致谢
我知道我有一些事情悬而未决,所以让我澄清一下:
- 每个数据集可以并且可能会有不同的趋势;即我不是在所有数据集中寻找相同的趋势。
- 程序用户将定义他们想要的合身程度
- 程序用户将定义子集在考虑趋势拟合之前必须有多连续
- 如果程序被扩展以允许任何类型的拟合(不仅仅是线性),用户将定义要拟合的模型——这不是一个优先事项,如果上述查询得到解决,那么我相信这个扩展会相对琐碎
- The outliers come about as a result of the nature of the experiment and the data acquisition technique whereby data from "bad" sections must still be collected even though these areas are known to give outliers. The discarding of these outliers DOES NOT imply that the data is being manipulated to fit any trend (statistics disclaimer, hehe).
java - Java中的字符识别
我有一个涉及在线字符识别的新项目(在写入字符时识别字符)。我的想法是每个字符都由适合数学模型的笔画定义。例如,“A”可以由三个线性笔划定义;'O' 可以定义为单个圆形笔划。使用线性回归的原因可能是因为并非每次笔画都是完美的直线或曲线。线性回归可用于形成笔画的“可接受范围”。
我的问题是:
有没有更好/更简单的方法来做到这一点?
Java 是否有一些执行线性回归的内置函数或模块?
有没有比 Java 更容易做到这一点的语言?
r - R中的线性回归和分组
我想使用该lm()
函数在 R 中进行线性回归。我的数据是一个年度时间序列,其中一个字段代表年(22 年),另一个字段代表州(50 个州)。我想为每个状态拟合一个回归,以便最后我有一个 lm 响应向量。我可以想象为每个状态执行 for 循环,然后在循环内执行回归并将每个回归的结果添加到向量中。然而,这似乎不太像 R。在 SAS 中,我会做一个“by”语句,而在 SQL 中,我会做一个“group by”。这样做的R方式是什么?
r - 使用 Lattice(或其他东西)在 R 中绘制 lme4 的回归结果
由于先前的答案,我已经使用 lme4 进行了回归。现在我对每个州都有一个回归拟合,我想使用 lattice 为每个州绘制 QQ 图。我还想以格子格式绘制每个状态的误差图。如何使用 lme4 回归的结果制作格子图?
下面是一个使用两种状态的简单示例(是的,我喜欢一个很好的头韵)。我想制作一个由对象制成的两个面板格子适合。
math - 多元线性回归
我正在尝试使用 GLSMultipleLinearRegression (来自 apache commons-math 包)进行多元线性回归。它期望协方差矩阵作为输入——我不知道如何计算它们。我有一组因变量和 3 个自变量数组。
知道如何计算协方差矩阵吗?
注意:我对 3 个自变量中的每一个都有 200 个项目
谢谢巴拉尼
_
regression - 来自最小二乘派生平面的法线向量
我有一组点,我可以得出以下形式的最小二乘解:
我计算的系数是正确的,但是如何在这种形式的方程中获得垂直于平面的向量?简单地使用这个方程中的 A、B 和 C 系数作为使用我的测试数据集的法线向量似乎并不正确。