2

有点困惑。我从我运行的报告中获得了一些 Loadrunner 分析。我是测试新手。我对第 90 个百分位的理解是,考虑到它采用第 90 个百分位并排除异常值,它呈现出更真实的画面。尽管我正在查看两个不同的报告,并且在这两个报告中,第 90 个百分位的响应时间都高于摘要报告中给出的平均响应时间。这怎么可能?

我正在查看事务响应时间图(百分位数)和最后 10% 的增长,因此告诉我采用 90% 应该会看到更低的响应时间。

 Example
Transaction 1

Min 0.012
Avg 1.919
Max 20.935
SD 2.718
90 Percentile 6.412

许多交易或多或少看起来像这样。为什么第 90 个百分位高于平均值?

4

4 回答 4

5

第 90 个百分位表示 90% 的值低于该值。在这种情况下,值将是您的响应时间。因此,如果您有 1000 个值并且第 90 个百分位是n,则其中 900 个值会低于n,而只有 100 个高于n- 所以平均值小于第 90 个百分位是有道理的。

于 2016-11-29T21:53:21.823 回答
4

中位数是第 50 个百分位数。它将始终低于 90%。如果您有一小部分数据集非常长,则平均值实际上可能高于 90%,从而将整个数据集的平均值拉高。

于 2016-11-30T16:34:54.867 回答
0

平均值与 n 分位数/中位数/四分位数/百分位数有很大不同。

可以设置一个平均值 > 中位数甚至 90% < 平均值的值。他们只是不一样的东西。

请参阅此https://math.stackexchange.com/questions/382117/average-is-higher-than-percentile-90

人们对其数据所做的一般假设依赖于未说明的假设,即数据遵循平均〜=中位数(如高斯)的中心分布。

看看幂律/帕累托定律,看看这个假设有多么错误。这同样适用于多峰分布。在没有适当分析的情况下不要做这样的假设是至关重要的,否则这只是某种“数据废话”

(顺便说一句,这就是为什么平均收入比中位数收入提供的信息少)

于 2019-03-15T14:14:04.273 回答
0

Giles 说:“第 90 个百分位意味着 90% 的值低于此值。在这种情况下,该值将是您的响应时间。因此,如果您有 1000 个值并且第 90 个百分位是 n,那么其中 900 个值将低于n,并且仅比 n 高 100 - 所以平均值小于第 90 个百分位是有道理的。” 对不起,我看不出它有什么意义。我想说,如果你去掉最长的响应,剩下的是更短的响应时间,所以在这种情况下,当你计算较小数字的平均值时,你会得到一个更小的数量:90% 总是小于平均,当然不是这样!

90% 不是为了展示网站对 90% 的客户的表现如何而发明的吗?那么,收集所有最常发生的结果并切断一些罕见的极端情况(在两端),这些极端情况并不经常发生?这可以解释为什么在 loadrunner 的输出中平均值几乎总是小于 90%。? 我认为这就是它的工作原理: 图片:90% 计算

于 2019-03-15T14:05:30.013 回答