4

在我们的游戏中有几个实例,我们希望在给定预期输出值的情况下随机化“支出”。例如,我们不是每次都奖励“10 个学分”,而是希望从长远来看平均奖励 10 个学分,并加入一些随机性,目的是让它变得更“有趣”,让它变得有点不可预测。

随意更改它甚至使其成为正态分布很容易,但这并没有真正针对“乐趣”进行优化。用户在 5 到 15 积分之间的效用差异相对较小,但如果有机会偶尔赢得 100 积分,那将是一个很大的抽奖,值得期待。

有没有针对赌徒优化的算法?它基本上是一个超级简单的老虎机——我希望有人做过研究,以确定是什么让这种东西上瘾和有趣,但我什至不知道从哪里开始寻找这样的东西。

4

2 回答 2

2

本文详细介绍了老虎机所使用的一些算法 ,包括创建“险胜”、“奖金模式”的常用方法,让赌博变得更有趣。

这是另一篇论文。尽管您可能需要在大学才能访问这本书的全文(除非您想为此付费)。

我不知道是否有人编写了实现这些方法的程序,但我希望旧机器中使用的想法在数字世界中仍能以某种方式发挥作用。

于 2012-08-03T15:47:44.263 回答
2

我认为 lavin 发布的论文听起来很有趣,应该研究一下,但在不了解老虎机算法的情况下,我会建议一些简单的东西。简单的做法是从两个不同的分布中随机选择,如下所示:

在 [0,1] 上选择一个随机均匀的 U
if (U <= p) 从 N(10,2.5) 中选择一个随机法线
if (U > p) 从 N(100,10) 中选择一个随机法线

在这里,您只需将 p 设置为奖励来自不太令人兴奋的分布的概率(显然 1-p 是它来自更令人兴奋的分布的概率)。您不需要对这些分布使用正态分布。更多的制服也可以。

于 2012-08-03T18:56:56.983 回答