4

我有一个真正随机字节的文件。我想要一个函数,它通过从文件中获取一个字节并对其进行缩放来返回给定范围内的随机整数。(这是正确的词吗?)

public int getInt(int l, int h) throws IOException {
    int m = (h - l) + 1;            // number of ranges needed
    int r = 256 / m;                // size of byte range
    int x = (r * m) - 1;            // maximum allowable byte value
    int b;
    do {
        try {                       // get random byte from file
            b = ram.readUnsignedByte();
        } catch (EOFException e) {  // catch EOF, reset pointer
            b = 255; ram.seek(0);   // and set b to maximum value
        }                           // so test will fail.
    } while(b > x);                 // if byte is greater than
                                    // allowable value, loop.
    return (b / r) + l;             // return random integer
}                                   // within requested range

所以这是我的功能。我担心通过缩放来破坏文件中字节的真正随机性。我读到我需要丢弃任何超过允许最大值的数字(因此对于数字 0-9,最大值为 249,因为我只剩下 7 个值可以分配给 10 个不同的组)。我的实现看起来正确吗?

另外,我想知道,仅通过使某些太大的字节无效,我是否会以任何方式扭曲分布?

4

1 回答 1

1

是的,为了避免偏差,您不能使用模数,您必须丢弃不在范围内的结果。

编程成功的关键是将你的任务分成合适的子任务。快速规格:

  1. 添加一个函数来计算存储给定数字需要多少位
  2. 添加一个从随机文件中读取和缓冲字节的类,并有方法为您提供一个整数,其中包含从文件中获取的一些位(其余位为 0)。
  3. 添加实际方法来获取您的随机数:
    • 计算结果的范围,并从中计算所需的位数
    • 循环获取位,添加下限,如果结果超过上限,则重试

请注意第 2 步:第一个实现可能非常粗糙,例如,您可以只获取 4 个字节作为整数并丢弃额外的位。稍后您可以优化此类以保留未使用的位并在下次使用它们,以避免浪费随机位。由于获得真正好的随机位通常有点昂贵,因此这种优化可能值得认真使用。

对于位操作,请参见例如这个 SO 问题: Java "Bit Shifting" Tutorial?

于 2012-12-04T12:27:18.657 回答