假设您想预测下一次船将访问的概率。您开始在船周期中的任意位置进行观察。当您进行观察时,您只能记录船是否可见(假设它是循环中的正确点,船总是可见)。在这个世界上,船的周期长度也是未知的,但具有周期性,而船的访问时间是未知的,但总是小于周期长度。还假设周期是一种固定的自然现象,可能不会改变。
案例 1. 观察的第一个小时你没有看到船。因此,预测下一小时内有船的概率将是任意的。我们观察到一艘船的第二个小时,我们预测第 3 个小时的概率很高。在第 4 个小时我们没有观察到船,我们现在可以确定这艘船通常可以观察 2 个小时(第 2 和第 3 个小时)。我们继续观察,在第 7 个小时,船再次可见。只有在这一点上,我们才知道循环长度(5 小时)和可观察船的持续时间(2 小时)。
案例 2. 第一个小时观察你看到一艘船。下一小时的预测概率很高。在第 4 小时,您没有观察到任何船只。此时船能见度至少为3小时。我们在 5、6、7、8 小时再次观察船,在 9 小时没有船。只有在 9 小时之后,我们才能有把握地说周期是 5 小时,能见度是 4 小时。
案例 3. 看到船的第一个小时。你去睡3个小时。在第 5 小时,您看不到船。你去睡3个小时。在第 9 点,您会看到一艘船。在 10、11、12 小时看到船的概率是多少?
我可以使用什么算法来解决这个问题?我认为隐藏马尔可夫模型可能会起作用,因为存在潜在的现象,但它不是直接可观察的。但在这种情况下,这种现象并不完全清楚。在我的特殊情况下,我可以用平均循环长度初始化算法。创建此算法的真正动机是观察结果在两者之间非常少。这个程序在训练阶段最有价值,因为如果知道循环长度和我们在循环中的位置,事情就会变得微不足道。
以下是使用8小时的平均历史周期长度和2小时的船持续时间给定 0、1、2 和 3次连续观察(X 表示看到船的观察,O 表示没有船的观察)大致可以输出的内容。仔细查看图表,您会注意到船可能返回的位置周围的概率有所增加。