performance - 为什么在衡量应用程序性能时平均值如此受欢迎

Question

在测量应用程序性能（例如响应时间）时，很容易遇到平均值（平均值）。ab，httpref以及许多其他实用程序正在报告均值和标准差。但从理论的角度来看，这对我来说没有多大意义。这就是为什么。

均值善于描述对称分布的总体，因为在对称分布的情况下，均值等于总体众数和期望值。但是响应时间不是分布对称的。它们更像是指数型的。在这种情况下，平均值什么也没告诉我们。

使用百分位值更方便，它告诉我们在响应百分比的情况下我们可以承受的响应时间。

我是否遗漏了某些东西，或者仅仅因为计算起来很简单而意味着流行？

score 2 · Accepted Answer

各种工具的功能不一定来自有意义的东西，而是来自用户的期望。

您绝对正确，分布是非负的并且严重偏斜，并且百分位数会提供更多信息。

或者，更像对数正态分布或卡方分布会更好一些。

score 1 · Accepted Answer

是的，你错过了一些东西。

描述性统计的全部意义在于呈现一些数字来描述（或表示或建模或......）大量数字。它们有助于理解大型数据集、从数据中提取信息、对精确比较大且令人困惑的数据集进行近似比较。

但是没有一个单一的描述性统计数据总是适合所有目的，也没有人要求你必须或应该或应该使用平均值。如果它不适合您的目的，请使用其他东西。

碰巧你写错了他们更像指数。在这种情况下，平均值什么也没告诉我们。 对于具有速率参数lambda的指数分布，平均值很简单1/lambda，因此平均值可以告诉您有关指数分布的所有信息。

score 0 · Accepted Answer

我不是统计学专家，但我相信平均值被大量使用，因为这些值有助于衡量系统的可扩展性。

您需要首先考虑您的平均值，以了解您的系统在某些工作负载下需要如何运行，并且这些需要是可预测的，您通常对异常值不太感兴趣，至少一开始不会。

当然，您需要查看您的最小值和峰值，以了解您的系统何时会遇到瓶颈，但平均值会向您显示我所说的正确且可预测的行为。

3 回答 3