5

我认为,通过查看代码,问题非常简单。我有一个随机数组(数组必须是随机的,一些代码已被排除,因为它与实际问题无关,但确实需要随机化)。对于数组中的每个元素,都有一个“概率”索引(此处描述为值本身,在 中$rules)假设暗示,如果满足其他条件(为了不相关而在此处删除),数组元素将被“触发”的概率(在这种情况下,数组元素的分数将增加 1)

考虑代码:

<?php
  // Taken from php.net/shuffle user notes
  // Shuffles an array order for the sake of foreach while maintaining
  // key => value associations
  function shuffle_assoc(&$array) {
    $keys = array_keys($array);
    shuffle($keys);
    foreach($keys as $key) {
      $new[$key] = $array[$key];
    }
    return $new;
  }

  $i = 1000000; // How many tests to perform

  // This is my rule list.  Each key is a simple color
  // and each value is a probability represented as a percent
  $rules = array(
    'black' => 20,
    'white' => 10,
    'red' => 40,
    'green' => 5,
    'blue' => 25,
  );

  // Initialize the scores array with all 0's
  // The "outs" will be used when the probability does not
  // occur in any of the rules
  $scores = array('outs' => 0);
  foreach($rules as $k => $v) { 
    $scores[$k] = 0;
  }

  $count = count($rules);

  for($x = 0; $x < $i; $x++) { 
    $rules = shuffle_assoc($rules);

    foreach($rules as $k => $probability) {
      $rand = mt_rand(1,100);
      //$probability = ??; I've tried applying many different operations here to "correct" the probability

      if($rand > $probability) { 
        continue; 
      } else {
        $scores[$k]++;
        continue 2;
      }
    }
    $scores['outs']++;
  }


  foreach($scores as $k => $v) { 
    echo "$k: " . (($v/$i)*100) . "% ($v/$i)\n";
  }

?>

预期输出(伪)。注意百分比对应的值$rules

outs: less than 1% (.../1000000)
black: 20% (.../1000000)
white: 10% (.../1000000)
red: 40% (.../1000000)
green: 5% (.../1000000)
blue: 25% (.../1000000)

示例输出:

outs: 30.7128% (307128/1000000)
black: 13.2114% (132114/1000000)
white: 6.3381% (63381/1000000)
red: 29.5247% (295247/1000000)
green: 3.1585% (31585/1000000)
blue: 17.0545% (170545/1000000)

我尝试过的事情和注意事项:

  • 如您所见,在循环中,我有一个注释掉的部分$probability = ??,我尝试了各种对我来说显而易见的方法来计算在每个元素中使用的实际概率,包括玩$count(规则计数),这就是为什么变量存在且未使用。

  • 它不必很明显,但最好在一组较小的数字(例如 1,000 次迭代)上具有稳定的结果。

  • 它可能非常模糊。+/- 5% 的差异不会伤害我的感受,尤其是在迭代次数较少的情况下,我知道大数理论在这里发挥作用。

  • 只要低于 1%-2%,出局的数量并不是什么大问题。我还尝试使用各种方法消除补牌,看看单独的补牌是否倾斜,有趣的是,当我有一次这样做时,我得到了 20% 的平分(即偶数)。

  • 此外,在“出局”上,我能够通过$rules从 100 向后开始强制概率“数字”(即找出一个精确的、最佳的方法。每次,我都会更接近一种颜色的结果,这会使其他颜色在一个很小但很明显的范围内倾斜。在这些数字中没有容易掌握的相关性,并且似乎是随机的,尽管很明显,结果与概率与大数字相比表现得很好。

告诉我有一个精确的方法来计算这个。它快把我逼疯了。

编辑:我有我的代码的最终版本,在下面两个答案的帮助下,这样做不需要在循环开始之前知道概率百分比,也不需要额外或嵌套循环(这是我特别需要的,我我想我应该在那部分更直接)..从某种意义上说,每次迭代,您都可以根据该特定迭代的属性动态拉动概率..这里的所有答案都是无价的,这是我的最终代码版本: http://pastebin.com/eB3TVP1E

4

2 回答 2

4

只需标准化结果,累积它们,然后你就完成了。

我的意思是:

  • 对数组的每个项目给出的所有概率求和以获得总数(100在你的情况下,但它很容易推广)
  • 将每个概率除以总数

例如:

$rules = array(
    'black' => 20,
    'white' => 10,
    'red' => 40,
    'green' => 5,
    'blue' => 25,
  );

将归一化为:

$rules_norm = array(
    'black' => 0.2,
    'white' => 0.1,
    'red' => 0.4,
    'green' => 0.05,
    'blue' => 0.25,
  );
  • 现在累积结果,以便为$rules_norm您中的每个元素计算所有先前元素的总和加上当前元素。

所以:

$rules_norm = array(
    'black' => 0.2,
    'white' => 0.3,
    'red' => 0.7,
    'green' => 0.75,
    'blue' => 1.0,
  );

现在有了这个,您可以在范围内提取一个随机浮点数,[0,1)并根据结果选择增加哪些元素:要增加一个元素的分数,只需从数组中的第一个元素开始,然后增加一个元素,使得$rand > $rules_norm[k]

于 2013-01-17T22:27:51.630 回答
2

Jack 在您的代码中实现的想法(如果概率总和 > 100 这将不起作用):

php小提琴

<?php
  // Taken from php.net/shuffle user notes
  // Shuffles an array order for the sake of foreach while maintaining
  // key => value associations
  function shuffle_assoc(&$array) {
    $keys = array_keys($array);
    shuffle($keys);
    foreach($keys as $key) {
      $new[$key] = $array[$key];
    }
    return $new;
  }

  $i = 1000000; // How many tests to perform

  // This is my rule list.  Each key is a simple color
  // and each value is a probability represented as a percent
  $rules = array(
    'black' => 20,
    'white' => 10,
    'red' => 40,
    'green' => 5,
    'blue' => 25,
  );

  // Initialize the scores array with all 0's
  // The "outs" will be used when the probability does not
  // occur in any of the rules
  $scores = array('outs' => 0);
  foreach($rules as $k => $v) { 
    $scores[$k] = 0;
  }

  $count = count($rules);
//$limits is what Jack called $rules_norm
$limits=array();
$limit=0;
foreach($rules as $k=>$v)
{
    $limit+=$v;
    $limits[$k]=$limit;
}
  for($x = 0; $x < $i; $x++) { 
      $rand = mt_rand(1,100);
foreach($limits as $k=>$v)
{
    if($v>=$rand)
    {
        $scores[$k]++;
        continue(2);
    }

}
    $scores['outs']++;
  }


  foreach($scores as $k => $v) { 
    echo "$k: " . (($v/$i)*100) . "% ($v/$i)\n";
  }

?>
于 2013-01-17T22:47:25.233 回答