1

在测量应用程序性能(例如响应时间)时,很容易遇到平均值(平均值)。abhttpref以及许多其他实用程序正在报告均值和标准差。但从理论的角度来看,这对我来说没有多大意义。这就是为什么。

均值善于描述对称分布的总体,因为在对称分布的情况下,均值等于总体众数和期望值。但是响应时间不是分布对称的。它们更像是指数型的。在这种情况下,平均值什么也没告诉我们。

使用百分位值更方便,它告诉我们在响应百分比的情况下我们可以承受的响应时间。

我是否遗漏了某些东西,或者仅仅因为计算起来很简单而意味着流行?

4

3 回答 3

2

各种工具的功能不一定来自有意义的东西,而是来自用户的期望。

您绝对正确,分布是非负的并且严重偏斜,并且百分位数会提供更多信息。

或者,更像对数正态分布或卡方分布会更好一些。

于 2012-07-14T11:47:33.163 回答
1

是的,你错过了一些东西。

描述性统计的全部意义在于呈现一些数字来描述(或表示或建模或......)大量数字。它们有助于理解大型数据集、从数据中提取信息、对精确比较大且令人困惑的数据集进行近似比较。

但是没有一个单一的描述性统计数据总是适合所有目的,也没有人要求你必须或应该或应该使用平均值。如果它不适合您的目的,请使用其他东西。

碰巧你写错了他们更像指数。在这种情况下,平均值什么也没告诉我们。 对于具有速率参数lambda的指数分布,平均值很简单1/lambda,因此平均值可以告诉您有关指数分布的所有信息。

于 2012-07-13T12:17:17.357 回答
0

我不是统计学专家,但我相信平均值被大量使用,因为这些值有助于衡量系统的可扩展性。

您需要首先考虑您的平均值,以了解您的系统在某些工作负载下需要如何运行,并且这些需要是可预测的,您通常对异常值不太感兴趣,至少一开始不会。

当然,您需要查看您的最小值和峰值,以了解您的系统何时会遇到瓶颈,但平均值会向您显示我所说的正确且可预测的行为。

于 2012-07-13T13:42:27.550 回答