1

我想根据过去发生的事件列表计算百分比概率。
数据看起来类似于此简化表,例如,当第一个值在过去为 8 时,事件发生的可能性为 72%。

1   76%
2   64%
4   80%
6   85%
7   83%
8   72%
11  70%

完整表的范围从 0 到 1030,有 377 行,但每天都在变化。我想向函数传递一个值,例如 3,并返回事件发生的百分比概率。我不需要确切的代码,但希望能指出正确的方向。谢谢

4

1 回答 1

0

根据您在问题评论中的回答,我建议使用插值——线性插值是最简单的答案。根据电子表格中的系列,概率模型看起来并不合适(第 1 列和第 3 列之间似乎没有明确的关系)。

举一个例子来说明这是如何工作的:假设你想要某个点 p 的概率,这在数据中是未观察到的。您观察到的小于p 的最大值是 p_low(对应概率为 f(p_low)),大于 p 的最小值是 p_high(概率为 f(p_high))。您对 p 的估计是:

interval = p_high - p_low
f_p_hat = ((p-p_low)/interval*f_p_low) + ((p_high-p)/interval*f_p_high)

这将对 p_low 和 p_high 的值的 pa 加权平均值进行估计,权重由 p 和 p_low 以及 p 和 p_high 之间的距离给出。例如,如果 p 在 p_low 和 p_high 之间等距,则 f_p_hat(您对 f(p) 的估计)只是 p_low 和 p_high 的平均值。

现在,如果您有理由怀疑端点处的估计值不准确(可能是由于样本量小),线性插值可能不起作用。如果是这样,就有可能对 p 周围的点的邻域进行(可能加权的)最小二乘拟合,并将其用作预测。如果是这种情况,我可以更详细地介绍一下。

于 2012-11-21T16:15:11.013 回答