2

我需要有效地进行多元线性回归。我正在尝试使用 Math.NET Numerics 包,但它似乎很慢 - 也许这是我编写它的方式?对于这个例子,我只有简单的(1 x 值)回归。

我有这个片段:

        public class barData
        {
            public double[] Xs;
            public double Mid;
            public double Value;

        }

        public List<barData> B;


        var xdata = B.Select(x=>x.Xs[0]).ToArray();
        var ydata = B.Select(x => x.Mid).ToArray();

        var X = DenseMatrix.CreateFromColumns(new[] { new DenseVector(xdata.Length, 1), new DenseVector(xdata) });
        var y = new DenseVector(ydata);

        var p = X.QR().Solve(y);
        var b = p[0];
        var a = p[1];
        B[0].Value = (a * (B[0].Xs[0])) + b;

这比这个纯 C# 运行大约慢 20 倍:

       double xAvg = 0;
        double yAvg = 0;

        int n = -1;
        for (int x = Length - 1; x >= 0; x--)
        {
            n++;
            xAvg += B[x].Xs[0];
            yAvg += B[x].Mid;
        }

        xAvg = xAvg / B.Count;
        yAvg = yAvg / B.Count;

        double v1 = 0;
        double v2 = 0;

        n = -1;
        for (int x = Length - 1; x >= 0; x--)
        {
            n++;
            v1 += (B[x].Xs[0] - xAvg) * (B[x].Mid - yAvg);
            v2 += (B[x].Xs[0] - xAvg) * (B[x].Xs[0] - xAvg);
        }

        double a = v1 / v2;
        double b = yAvg - a * xAvg;

        B[0].Value = (a * B[Length - 1].Xs[0]) + b;

另外,如果 Math.NET 是问题所在,那么如果有人知道为多个 X 更改我的纯代码的简单方法,我将不胜感激

4

1 回答 1

2

使用 QR 分解是一种非常通用的方法,可以为任何具有线性参数的函数提供最小二乘回归解决方案,无论它多么复杂。因此,它无法与非常具体的直接实现(计算时间)竞争也就不足为奇了,尤其是在y:x->a+b*x. 不幸的是,Math.NET Numerics 不提供直接回归例程,但您可以使用它。

但是,您仍然可以尝试一些方法来提高速度:

  • 使用thin而不是完整的QR分解,即传递QRMethod.ThinQR方法
  • 使用我们的原生 MKL 提供程序(更快的 QR,但不再是纯托管代码)
  • 调整线程,例如尝试完全禁用多线程(Control.ConfigureSingleThread())或调整其参数

如果数据集非常大,还有更有效的方法来构建矩阵,但这可能与 QR 无关(-> 性能分析!)。

于 2013-05-11T13:01:48.427 回答