2

我正在尝试使用rcoin以相等概率返回 0 或 1 的函数生成 0 到 99 范围内的随机数。我编写了以下代码,将连续调用rcoin函数生成的二进制数转换,然后在数字小于 100 的条件下返回它。这是 R 代码。

rcoin <- function() {
  rbinom(n = 1, size = 1, prob = 0.5)
}

r100 <- function(n=100) {
  v = n + 1
  while(v > n) {
    v = sum(sapply(0:6, function(i) rcoin() * 2 ^ i))
  }
  v
}

val_plot <- function() {
  N = 10000
  rand_sample <- rep(0, N)
  for (i in 1:N){
    rand_sample[i] = r100()
  }
  hist(rand_sample, breaks = 100)
}

val_plot() 

它应该产生从 0 到 99 的均匀随机数,因为截断的均匀分布也是均匀的。但是当我绘制 10000 个生成值的直方图时,我看到值 0 生成的次数异常多,但所有其他值都遵循均匀分布。为什么?我猜这是因为二进制数“1111111”被拒绝,而“0000000”没有。但是我该如何解决这个问题呢?有什么办法可以改善吗?

4

1 回答 1

6

这归结为使用的问题hist,而不是函数本身。解决:

1)替换while(v > n) {while(v >= n) {所以我们生成低于 100 的数字并拒绝 100 或更高的数字。否则,输出的r100范围是 0 到 100,而不是 0 到 99。

2) 替换hist(rand_sample, breaks = 100)hist(rand_sample, breaks = 0:100, right = F)。否则,默认hist设置会将 0 和 1 分箱,并使第一个箱看起来太大。

我们也可以从简单的内置均匀分布中看到这种行为。

hist(floor(runif(1E6, min = 0, max = 100)), breaks = 100)

在此处输入图像描述

hist(floor(runif(1E6, min = 0, max = 100)), breaks = 0:100, right = F)

在此处输入图像描述

于 2019-12-28T04:24:45.770 回答