在我们的游戏中有几个实例,我们希望在给定预期输出值的情况下随机化“支出”。例如,我们不是每次都奖励“10 个学分”,而是希望从长远来看平均奖励 10 个学分,并加入一些随机性,目的是让它变得更“有趣”,让它变得有点不可预测。
随意更改它甚至使其成为正态分布很容易,但这并没有真正针对“乐趣”进行优化。用户在 5 到 15 积分之间的效用差异相对较小,但如果有机会偶尔赢得 100 积分,那将是一个很大的抽奖,值得期待。
有没有针对赌徒优化的算法?它基本上是一个超级简单的老虎机——我希望有人做过研究,以确定是什么让这种东西上瘾和有趣,但我什至不知道从哪里开始寻找这样的东西。