1

有没有办法从标准偏差和平均值生成贝尔曲线?我已阅读对此的参考,但找不到算法。

我有一个数字列表,它们是预先标准化的查找(分数=>百分位数)。我已经确定了范围,我需要从中绘制一条钟形曲线,以便我可以为曲线下的区域部分着色以表示图表上的分数(我想是一个面积图/infrographic esk)。我真的被困在第一个障碍上。

我计划通过以下方式排列数据来绘制直方图:

int count = data.Count-1;  

        for (int i = 0; i < count; i++ )
        {
            data[i] = data[i + 1] - data[i]; //range
        }

        data[data.Count - 1] = 0; //make sure the curve comes back to 0

非正常数据

我需要从这些数据中绘制一个钟形曲线。但并非所有数据集都遵循上述输出中的正常偏差。

那么将这些数据变成钟形曲线的最佳方法是什么?

我可以使用数据的标准偏差和平均值来计算沿曲线的 n 个坐标,然后将分数转置到该曲线上以构建图表吗?

或者..我是否应该尝试将现有数据标准化为曲线,然后将附加值插入数据集中以使输出平滑?

谢谢你的帮助!

4

1 回答 1

2

我不确定我是否完全理解您的要求,但这就是我解释您的问题的方式。

如果您的集合中有一定数量的观察值,您可以通过划分数据范围并根据此http://en.wikipedia.org/wiki/Normal_distribution从标准化正态变量计算理论百分比来计算直方图#Standardizing_normal_random_variables

例如,假设您的平均值为 5,标准差为 1,样本为 1000。那么我们知道,大约 68% 的正态分布位于平均值两侧的 1 SD 范围内。因此,在您的直方图箱 [4,5] 和 [5,6] 中,您将分别有 340 个观察值。同样,大约 13% 的人口位于 [mean-2xSD,mean - 1 x SD] 和 [mean + 1 x SD,mean + 2 x SD] 区间内。在这个简单的示例中,您将在区间 [3,4] 和 [6,7] 中生成 130 的观察计数。

通过使用标准正态变量表在区间内查找适当的总体百分比,您显然可以根据需要考虑更精细的区间。然后,您将在直方图中得到一个理想的理论正态分布样本。然后,您可以对这些点进行插值以获得平滑的曲线以覆盖到直方图上,

于 2012-07-18T15:59:19.340 回答