问题标签 [regression]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
7 回答
240 浏览

testing - 我应该继续注册失败吗?

我正在为我维护的应用程序开发自动回归测试套件。在开发自动化回归测试时,我遇到了一些几乎可以肯定是错误的行为。所以,就目前而言,我已经修改了自动回归测试以不记录失败——我的意思是,它故意让这种不良行为过去。

所以,我对这个网站上其他人的意见很感兴趣。显然,我将在我们的缺陷跟踪中添加一个错误,以确保此错误行为得到修复。但是是否有任何令人信服的理由(无论哪种方式)要么更改回归测试以不断指示失败,要么让回归测试中断并且在我们能够修复有缺陷的行为之前不失败?我认为这是其他类型问题中的六分之一,但我在这里问是因为我认为其他人可能会有不同的看法。


@保罗·汤布林,

明确一点——我从未考虑过删除测试;我只是在考虑修改通过/失败条件以允许失败,而不会在每次运行测试时都出现在我面前。

我有点担心由于已知原因导致的重复失败最终在 C++ 中被视为警告。我知道开发人员会在他们的 C++ 代码中看到警告并忽略它们,因为他们认为它们只是无用的噪音。我担心在回归套件中留下一个已知的失败可能会导致人们开始忽略其他可能更重要的失败。

顺便说一句,以免我被误解,我认为 C++ 中的警告是编写强代码的重要帮助,但从我遇到的其他 C++ 开发人员来看,我认为我是少数。

0 投票
6 回答
2125 浏览

perl - Perl 辅助回归测试

是否有一个 Perl 模块可以让我查看程序(或函数)的实际输出和参考输出之间的差异?如果存在差异,则测试失败。

此外,如果存在差异但输出正常(因为功能已更改),我希望能够将实际输出提交为将来的参考输出。

0 投票
3 回答
792 浏览

optimization - 稀疏最小二乘回归工具

我想用几十万个例子做稀疏的高维(几千个特征)最小二乘回归。我很高兴使用非花哨的优化——随机梯度下降很好。

有谁知道任何已经为此实现的软件,所以我不必自己写信?

亲切的问候。

0 投票
3 回答
2980 浏览

equation - 2 变量线性回归方程

我们正在使用一种没有线性回归函数的编程语言。我们已经实现了一个单变量线性方程:

y = Ax + B

并使用类似于此 Stack Overflow 答案的解决方案从数据中简单地计算了 A 和 B 系数。

我知道随着变量的添加,这个问题在几何上变得更加困难,但为了我们的目的,我们只需要再添加一个:

z = Ax + By + C

在给定 x、y 和 z 的数组的情况下,有没有人有封闭形式的方程或任何语言的代码可以求解 A、B 和 C?

0 投票
9 回答
1279 浏览

machine-learning - 我认为是机器学习问题的最佳方法

我在这里需要一些专家指导,了解什么是我解决问题的最佳方法。我研究了一些机器学习、神经网络和类似的东西。我已经调查了 weka,某种贝斯解决方案.. R.. 几种不同的东西。不过,我不确定如何真正进行。这是我的问题。

我拥有或将拥有大量事件......最终大约有 100,000 个左右。每个事件由几个(30-50)个自变量和一个我关心的因变量组成。在确定因变量的值时,一些自变量比其他变量更重要。而且,这些事件与时间相关。今天发生的事情比十年前发生的事情更重要。

我希望能够为某种学习引擎提供一个事件,并让它预测因变量。然后,知道这个事件(以及之前发生的所有事件)的因变量的真正答案,我希望它可以训练后续的猜测。

一旦我知道了编程方向,我就可以进行研究并弄清楚如何将我的想法转化为代码。但我的背景是并行编程,而不是这样的东西,所以我很想对此有一些建议和指导。

谢谢!

编辑:这里有更多关于我要解决的问题的详细信息:这是一个定价问题。假设我想预测一本随机漫画书的价格。价格是我唯一关心的。但是可以想出很多自变量。是超人漫画还是凯蒂猫漫画。它几岁了?什么条件?等等等等。经过一段时间的训练,我希望能够给它关于我可能正在考虑的漫画书的信息,并让它给我一个合理的漫画书期望值。好的。所以漫画书可能是一个虚假的例子。但你得到了一般的想法。到目前为止,从答案来看,我正在对支持向量机和朴素贝叶斯进行一些研究。感谢您迄今为止的所有帮助。

0 投票
6 回答
24456 浏览

statistics - 简单的多维曲线拟合

我有一堆数据,一般是a,b,c,...,y

其中 y = f(a, b, c...)

其中大多数是三四个变量,并且有 10k - 10M 记录。我的一般假设是它们本质上是代数的,例如:

y = P1 a^E1 + P2 b^E2 + P3 c^E3

不幸的是,我上一次统计分析课是在 20 年前。获得 f 的良好近似值的最简单方法是什么?具有极小学习曲线的开源工具(即我可以在一小时左右得到一个体面的近似值的工具)将是理想的。谢谢!

0 投票
5 回答
18829 浏览

3d - 曲线拟合 3D 数据集

2D 数据的曲线拟合问题是众所周知的(LOWESS 等),但给定一组 3D 数据点,我如何将 3D 曲线(例如平滑/回归样条)拟合到该数据?

更多:我试图找到一条曲线,拟合向量 X、Y、Z 提供的数据,这些向量没有已知的关系。本质上,我有一个 3D 点云,需要找到一个 3D 趋势线。

更多:我为歧义道歉。我尝试了几种方法(我还没有尝试修改线性拟合),随机 NN 似乎效果最好。即,我从点云中随机选择一个点,找到它的邻居的质心(在任意球体内),迭代。连接质心以形成平滑样条曲线被证明是困难的,但获得的质心是可以通过的。

为了澄清问题,数据不是时间序列,我正在寻找最能描述点云的平滑样条曲线,即,如果我要将这个 3D 样条曲线投影到由任何 2 个变量形成的平面上,投影样条曲线 (到 2D 上)将是投影点云(到 2D 上)的平滑拟合。

IMG:我已经包含了一张图片。红点代表从上述方法获得的质心。

3D 点云和局部质心 http://img510.imageshack.us/img510/2495/40670529.jpg

0 投票
1 回答
434 浏览

regression - 有没有回归模型的工具?

我需要从一组示例中推导出线性/二次方程。有没有可用的工具?

0 投票
1 回答
267 浏览

math - 连续值的 m 估计

我正在构建一个自定义回归树,并希望使用 m-estimate 进行修剪。

有谁知道如何计算。

http://www.ailab.si/blaz/predavanja/UISP/slides/uisp07-RegTrees.ppt可能会有所帮助(幻灯片 12,Em 应该是什么样子?)

0 投票
1 回答
403 浏览

statistics - 具有目标函数的多元映射/回归

概述
我有一个维度为 N 的“输入”的多元时间序列,我想将其映射到维度为 M 的输出时间序列,其中 M < N。输入的范围为 [0,k],输出的范围为 [0,1 ]。我们将序列中某个时间片的输入向量称为“ I[t] ”,将输出向量称为“ O[t] ”。

现在,如果我知道对<I[t], O[t]>的最佳映射,我可以使用一种标准的多元回归/训练技术(例如 NN、SVM 等)来发现映射函数。

问题
我不知道特定<I[t], O[t]>对之间的关​​系,而是对输出时间序列的整体适应度有所了解,即适应度由完整输出序列上的惩罚函数控制。

我想确定映射/回归函数“ f ”,其中:

这样惩罚函数 P(O) 被最小化:

[请注意,惩罚函数 P 正在将f的多次应用生成的结果系列应用于I[t]的跨时间。也就是说fI[t]的函数,而不是整个时间序列]

I 和 O 之间的映射非常复杂,以至于我不知道哪些函数应该构成它的基础。因此,期望必须尝试许多基函数。

对解决此问题的一种方法有看法,但不希望对提案产生偏见。

想法?