我今天刚开始阅读有关马尔可夫链生成器的更多信息,并且对构建它的整个过程非常感兴趣。据我了解,未来状态取决于统计的过去状态到现在。
例子:
你好世界。你好,多莉。你好世界。
在该来源中,“World”大约有 66% 的时间跟随“Hello”。
如果总是这样,那么您如何避免每次都输出相同的结果?统计出现不会随静态字符串而改变,所以我是否可以假设不会生成任何变体,除非源数据以某种方式被修改?
考虑到统计值,我如何从静态源中获得变化,但又允许一些灵活性?使用上面的示例,当“Dolly”仅在 33% 的情况下跟随“Hello”时,如何让我的生成器跟随“Hello”和“Dolly”?
我想我要问的是,我如何根据当前选择之后单词的统计存在来确定下一次选择的概率?这样一来,“多莉”出现了 33% 的时间,而“世界”出现了 66% 的时间——还是我完全迷路了?