0

我对如何进行 z-score 标准化感到困惑。我找到了执行此操作的方程式,需要平均值和标准差,但鉴于我的情况,我不确定如何解决这个问题。

我的系统中有 2 个分类器。要一起使用分数,我知道我需要对它们进行归一化,因为它们在尺度等方面会有所不同。我希望为此使用 z 分数归一化。我的问题是,考虑到两个分类器的 2 个分数,我需要对分数做什么才能使 z 分数标准化?我希望能够组合/比较它们。

我(可能有缺陷!)的理解是,对于分类器分数集,我们使用均值和标准差。但是我们不能总是假设我们已经有一个分数集来获得平均值和标准差,可以吗?

4

1 回答 1

-1

要计算给定一组数字的 z 分数,您需要计算样本均值和样本偏差。从每个分数中减去平均值并除以标准差。考虑下面的一组数字,其中每个观察值都是从 0 到 100 的测试分数。

{40, 50, 60, 55, 70, 80, 90}

如果您想比较它们的另一组测试分数,其中测试分数范围从 0 到 250,例如:

{100, 115, 214, 50, 200, 80, 90}

您无法直接比较它们。即第二盘80分明显比第一盘80分差(80/250 vs 80/100)。一种方法是使用 z 分数。他们计算如下:

  1. 找到平均值

    第一组的平均值是:63.57143 第二组的平均值是:121.2857

  2. 从每个分数中减去样本均值。这将为您提供一组以零为中心的数字。

    {-23.571429,-13.571429,-3.571429,-8.571429,6.428571,16.428571,26.428571}

  3. 计算与原始集合的标准差,并将“居中”分数除以该数字:

    设置 1 sigma = 17.49149

    设置 2 sigma = 61.98041

这被计算为:

{-1.3475937,-0.7758873,-0.2041809。-0.4900341, 0.3675256, 0.9392320, 1.5109384} {-0.3434265, -0.1014145, 1.4958643, -1.1501330, 1.2699865, -0.6661091, -0.5047678}

现在你有两组数字可以直接比较。零值意味着它是集合的平均值。比集合平均值高 1 个标准差的值。值 -1 表示它比平均值低一个标准差,依此类推。

于 2016-06-12T01:38:37.213 回答