0

我有一个数据集,其中包含与我们合作的所有提供商的录取率。我需要将这些数据分成四分位数,以便每个提供商都可以看到他们的费率与其他提供商相比的位置。比率从 7% 到 89% 不等。谁能建议我如何做到这一点?我不确定这是否是提出这个问题的正确地方,但如果有人可以帮助我解决这个问题,我将不胜感激。

另一个问题是,如果提供者的数量非常小,例如:2/4 = 50%,则提供者可能会落入更差的四分位,但这并不意味着提供者的表现很差,因为数量太少了。我希望这是有道理的。如果我能进一步澄清,请告诉我。

4

2 回答 2

0

有一些方法可以在不进行完整排序的情况下获得分位数,但除非你有大量数据,否则如果你还没有这些算法,那么实施这些算法是没有意义的。假设您有一个sort()可用的功能,您需要做的就是:

  1. 给定n 个数据点。
  2. 对数据点进行排序。
  3. 在排序后的数据中找到n/4,n/2和th 点,它们是你的四分位数。3*n/4

正如您所说,如果n小于某个数字(您必须自己决定),您可能想说四分位数结果是“不适用”或类似的。

于 2013-07-16T20:46:31.747 回答
0

第一个问题:对于小的n,不要使用四分位数。n是否小是任意的。

于 2013-07-16T20:44:37.643 回答