1

我正在做一个任务,我应该计算一个事件的密度。假设某个事件在几秒钟内发生了 5 次,这意味着它的密度将高于它在几小时内发生 5 次的密度。

我拥有事件发生的时间。

我首先考虑计算每两个连续事件之间的经过时间,然后使用这些值的平均值和平均值。

我的问题是我不知道如何通过数学准确地表示这种密度概念。假设我有 5 个事件发生得非常接近,然后是长时间的休息,然后又有 5 个事件发生得非常接近。我希望能够将其表示为高密度。我应该怎么做?

在最后一个例子中,我知道我的平均值不会真正具有代表性,但我的标准差会表明这一点。但是,我怎么能有一个密度值(假设在 0 和 1 之间),我可以用它来对不同的事件进行排名?

谢谢您的帮助!

4

2 回答 2

1

我会尝试调和平均值,它代表事件发生的速率,仍然给你一个平均时间值。它定义为:

调和平均定义

我认为它的行为接近你所期望的,因为它测量你想要的,但不在 0 和 1 之间并且具有相反的趋势(小值意味着密集,大值意味着稀疏)。让我们看一些你的例子:

  1. 约 5 个事件在一小时内。为简单起见,我们假设每个事件之间有 10 分钟。然后我们有H = 6 /(6 * 1/10) = 10
  2. 10 分钟内约 5 个事件,然后直到一小时结束(50 分钟)。让我们假设所有的短间隔都是 2.5 分钟,那么H = 6 / (5/2.5 + 1/50) = 6 * 50 / 101 = 2.97
  3. 10 分钟内约 5 个事件,但此循环每半小时重新启动一次,因此我们有 20 分钟作为最后一个间隔而不是 50 分钟。然后我们得到H = 6 / (5/2.5 + 1/20) = 6 * 20 / 41 = 2.92

正如您所看到的那样,由于我们使用了倒数,一组中较长和较稀有的值的影响被削弱了,因此“爆发之间”行为的权重较小。您还可以比较具有相同“突发密度”但发生频率不同的行为,您将获得接近但其排序仍反映这种差异的数字。

于 2015-01-06T13:22:53.513 回答
0

为了使密度有意义,您需要定义两件事:

  • 你看它的范围,
  • 和时间单位

之后,您可以说,例如,从 12:00 到 12:10,事件的密度平均为 10 次/分钟。

在你的情况下什么是有意义的显然取决于你的输入数据是什么。如果您的测量持续 1 小时并且您有数百万个条目,那么可能秒或毫秒是单位的更好选择。如果您测量一周并有几个条目,那么天是一个更好的单位。

于 2015-01-06T12:35:07.850 回答