1

源数据:

    static double[] felix = new double[] { 0.003027523, 0.002012256, -0.001369238, -0.001737660, -0.001647287, 
        0.000275154, 0.002017238, 0.001372621, 0.000274148, -0.000913576, 0.001920263, 0.001186456, -0.000364631, 
        0.000638337, 0.000182266, -0.001275626, -0.000821093, 0.001186998, -0.000455996, -0.000547445, -0.000182582,
        -0.000547845, 0.001279006, 0.000456204, 0.000000000, -0.001550388, 0.001552795, 0.000729594, -0.000455664, 
        -0.002188184, 0.000639620, 0.000091316, 0.001552228, -0.001002826, 0.000182515, -0.000091241, -0.000821243,
        -0.002009132, 0.000000000, 0.000823572, 0.001920088, -0.001368863, 0.000000000, 0.002101800, 0.001094291, 
        0.001639643, 0.002637323, 0.000000000, -0.000172336, -0.000462665, -0.000136141 };

方差函数:

    public static double Variance(double[] x)
    {
        if (x.Length == 0)
            return 0;
        double sumX = 0;
        double sumXsquared = 0;
        double varianceX = 0;
        int dataLength = x.Length;


        for (int i = 0; i < dataLength; i++)
        {
            sumX += x[i];
            sumXsquared += x[i] * x[i];
        }

        varianceX = (sumXsquared / dataLength) - ((sumX / dataLength) * (sumX / dataLength));
        return varianceX;
    }

Excel 和一些在线计算器说方差是 1.56562E-06 而我的函数给了我 1.53492394804015E-06。我开始怀疑 C# 是否有准确性问题或什么。以前有人遇到过这种问题吗?

4

2 回答 2

13

您所看到的是样本方差和总体方差之间的差异,与浮点精度或 C# 的浮点实现的准确性无关。

您正在计算总体方差。Excel 和该网站正在计算样本方差。

Var 和 VarP 是不同的计算,您需要注意使用的是哪一个。(不幸的是,人们经常将它们称为可互换的,而实际上它们不是可互换的。标准差也是如此)

您数据的样本方差为 1.56562E-06,总体方差为 1.53492394804015E-06。

不久前在 codeproject 上发布的一些代码中

样本中的方差

public static double Variance(this IEnumerable<double> source)
{
    double avg = source.Average();
    double d = source.Aggregate(0.0, (total, next) => total += Math.Pow(next - avg, 2));
    return d / (source.Count() - 1);
}

人口差异

public static double VarianceP(this IEnumerable<double> source)
{
    double avg = source.Average();
    double d = source.Aggregate(0.0, (total, next) => total += Math.Pow(next - avg, 2));
    return d / source.Count();
}
于 2010-07-23T18:55:09.547 回答
1

这是另一种实现,有时在数字上表现更好:

        mean = Average(data);
        double sum2 = 0.0, sumc = 0.0;


        for (int i = 0; i < data.Count; i++)
        {
           double dev = data[i] - mean;
           sum2 += dev * dev;
           sumc += dev;
        }

        return (sum2 - sumc * sumc / data.Count) / data.Count;
于 2011-04-20T21:10:29.883 回答