我在统计领域不熟练,所以我希望这对某人来说很容易,我缺乏技能也使得很难找到关于这个主题的正确搜索词,所以我可能在搜索中错过了我的答案。反正。我正在查看数据数组,例如 CPU 使用率。我如何才能在尽可能少的数据点中捕获准确的信息,比如一组数据,其中包含 1 小时核心 CPU 使用率的 1 秒时间间隔,其中前 30 分钟为 0%,后 30 分钟为100%。现在,我能想到的一个数据点就是平均值,即 50%,在这种情况下根本没有用。此外,另一种情况是使用图就像一个波浪,在 0-100 之间均匀地上下波动,但仍然给出 50% 的平均值。我怎样才能捕获这些数据?谢谢。
问问题
558 次
1 回答
1
如果我理解您的问题,这实际上更像是一个统计问题而不是编程问题。你的意思是,用尽可能少的变量捕捉人口曲线的最佳方法是什么?
首先,大多数标准统计数据的假设意味着系统或多或少是稳定的(尽管,如果系统不稳定,你得到的数字会让你知道,因为它们是无意义的)。
您需要了解的主要统计指标是平均值、总体规模和标准差。由此,您可以计算出定义为总体曲线的粗钟形曲线,并根据标准差的比例了解曲线的准确性。
这为您提供了标准钟形曲线的三变量模式。
如果您想更详细地了解,您可以添加 Cpk、Ppk,它们是计算字段。
否则,您可能需要进行非线性回归和曲线拟合,最好根据具体情况进行处理(不适合编程)。
查看以下站点以计算 Cp、Cpk、Pp 和 Ppk:
http ://www.qimacros.com/control-chart-formulas/cp-cpk-formula/
http://www.macroption.com/population-sample-variance-standard-deviation/
于 2012-07-23T21:19:42.577 回答