events - 时间事件的密度

Question

我正在做一个任务，我应该计算一个事件的密度。假设某个事件在几秒钟内发生了 5 次，这意味着它的密度将高于它在几小时内发生 5 次的密度。

我拥有事件发生的时间。

我首先考虑计算每两个连续事件之间的经过时间，然后使用这些值的平均值和平均值。

我的问题是我不知道如何通过数学准确地表示这种密度概念。假设我有 5 个事件发生得非常接近，然后是长时间的休息，然后又有 5 个事件发生得非常接近。我希望能够将其表示为高密度。我应该怎么做？

在最后一个例子中，我知道我的平均值不会真正具有代表性，但我的标准差会表明这一点。但是，我怎么能有一个密度值（假设在 0 和 1 之间），我可以用它来对不同的事件进行排名？

谢谢您的帮助！

score 1 · Accepted Answer

我会尝试调和平均值，它代表事件发生的速率，仍然给你一个平均时间值。它定义为：

$调和平均定义$

我认为它的行为接近你所期望的，因为它测量你想要的，但不在 0 和 1 之间并且具有相反的趋势（小值意味着密集，大值意味着稀疏）。让我们看一些你的例子：

约 5 个事件在一小时内。为简单起见，我们假设每个事件之间有 10 分钟。然后我们有H = 6 /(6 * 1/10) = 10
10 分钟内约 5 个事件，然后直到一小时结束（50 分钟）。让我们假设所有的短间隔都是 2.5 分钟，那么H = 6 / (5/2.5 + 1/50) = 6 * 50 / 101 = 2.97
10 分钟内约 5 个事件，但此循环每半小时重新启动一次，因此我们有 20 分钟作为最后一个间隔而不是 50 分钟。然后我们得到H = 6 / (5/2.5 + 1/20) = 6 * 20 / 41 = 2.92

正如您所看到的那样，由于我们使用了倒数，一组中较长和较稀有的值的影响被削弱了，因此“爆发之间”行为的权重较小。您还可以比较具有相同“突发密度”但发生频率不同的行为，您将获得接近但其排序仍反映这种差异的数字。

score 0 · Accepted Answer

为了使密度有意义，您需要定义两件事：

之后，您可以说，例如，从 12:00 到 12:10，事件的密度平均为 10 次/分钟。

在你的情况下什么是有意义的显然取决于你的输入数据是什么。如果您的测量持续 1 小时并且您有数百万个条目，那么可能秒或毫秒是单位的更好选择。如果您测量一周并有几个条目，那么天是一个更好的单位。

2 回答 2