1

我正在尝试对我的流媒体视频网站进行一些数据分析。为了帮助确定问题是在我这边还是在用户那边,我已经开始收集流的带宽的平均值和标准差。我不确定的是如何确定正常流应该是什么样子。

为了弄清楚正常的流应该是什么样子,我想找到以下内容:

  1. 均值 - 什么是正常带宽
  2. StdDev of Means - 人口的带宽变化多少
  3. StdDevs 的平均值 - 正常的变化量是多少
  4. StdDevs 的 StdDev - 平均 StdDev 变化多少

这些统计数据有意义吗?

基本上,我试图通过寻找低带宽或高度可变带宽之类的东西来检测不良流。所以,我想我可以找到一些基线,然后寻找异常值。

此外,保留每个样本的所有数据是不可行的,因此我只能使用汇总统计数据。如果您还有其他建议,我会记录这将是一个很大的帮助。

4

1 回答 1

0

如果观察的数量足够大(比如 > 30),只需建立一个置信区间(这里我用 alpha=0.05 来做)

CI=[sample_mean-(sample_st.dev*1.96)/sqrt(观察次数);sample_mean+(sample_st.dev*1.96)/sqrt(观察次数)]

这是一个您确信 95% 样本的平均值落入的范围。要扩大您的置信区间,请在统计表上查找 z(alpha/2) 并将其值替换为 1.96(即 alpha= 0.05)。

Ps 以下参数对我来说没有多大意义.. StdDevs 的平均值 - StdDevs 的正常变化量是多少 StdDevs - StdDev 的平均变化量是多少

于 2012-04-05T14:20:38.673 回答