25

在给定任意种子值的情况下,是否有任何已知算法可以在线性时间和恒定空间(当输出迭代产生时)中生成混洗范围 [0..n)?

假设 n 可能很大,例如数百万,因此不需要潜在地产生每个可能的排列,尤其是因为它不可行(种子值空间需要很大)。这也是需要恒定空间的原因。(所以,我特别不是在寻找数组改组算法,因为这要求范围存储在长度为 n 的数组中,因此会使用线性空间。)

我知道问题 162606,但它没有给出这个特定问题的答案 - 从排列索引到该问题中给出的排列的映射将需要巨大的种子值空间。

理想情况下,它会像一个周期和范围为 的LCG ,但选择和用于 LCGn的艺术是微妙的。简单地满足 LCG 的限制并在整个周期内满足我的要求,但我想知道是否有更好的想法。acac

4

5 回答 5

8

根据Jason 的回答,我在 C# 中做了一个简单直接的实现。找到大于 N 的 2 的下一个最大幂。这使得生成 a 和 c 变得微不足道,因为 c 需要是互质的(意味着它不能被 2 整除,也就是奇数),并且 (a-1) 需要能被 2 整除,并且 (a-1) 需要能被 4 整除。从统计学上讲,应该需要 1-2 个同余才能生成下一个数(因为 2N >= M >= N)。

class Program
{
    IEnumerable<int> GenerateSequence(int N)
    {
        Random r = new Random();
        int M = NextLargestPowerOfTwo(N);
        int c = r.Next(M / 2) * 2 + 1; // make c any odd number between 0 and M
        int a = r.Next(M / 4) * 4 + 1; // M = 2^m, so make (a-1) divisible by all prime factors, and 4

        int start = r.Next(M);
        int x = start;
        do
        {
            x = (a * x + c) % M;
            if (x < N)
                yield return x;
        } while (x != start);
    }

    int NextLargestPowerOfTwo(int n)
    {
        n |= (n >> 1);
        n |= (n >> 2);
        n |= (n >> 4);
        n |= (n >> 8);
        n |= (n >> 16);
        return (n + 1);
    }

    static void Main(string[] args)
    {
        Program p = new Program();
        foreach (int n in p.GenerateSequence(1000))
        {
            Console.WriteLine(n);
        }

        Console.ReadKey();
    }
}
于 2009-01-22T01:32:59.430 回答
7

这是来自FryGuy 的回答的线性同余生成器的 Python 实现。因为无论如何我都需要写它,并认为它可能对其他人有用。

import random
import math

def lcg(start, stop):
    N = stop - start

    # M is the next largest power of 2
    M = int(math.pow(2, math.ceil(math.log(N+1, 2))))

    # c is any odd number between 0 and M
    c = random.randint(0, M/2 - 1) * 2 + 1

    # M=2^m, so make (a-1) divisible by all prime factors and 4
    a = random.randint(0, M/4 - 1) * 4 + 1

    first = random.randint(0, M - 1)
    x = first
    while True:
        x = (a * x + c) % M
        if x < N:
            yield start + x
        if x == first:
            break

if __name__ == "__main__":
    for x in lcg(100, 200):
        print x,
于 2011-05-27T23:30:59.013 回答
5

听起来您想要一种算法,该算法可以保证产生从 0 到 n-1 的循环而没有任何重复。根据您的要求,几乎可以肯定有一大堆。如果您想深入研究其背后的理论,群论将是最有用的数学分支。

如果您想要快速并且不关心可预测性/安全性/统计模式,LCG 可能是最简单的方法。您链接到的维基百科页面包含这组(相当简单的)要求:

一般LCG的周期最多为m,而对于a的一些选择则要小得多。当且仅在以下情况下,LCG 将有一个完整的周期:

  1. c 和 m 互质,
  2. a - 1 可以被 m 的所有素因子整除
  3. a - 1 是 4 的倍数,如果 m 是 4 的倍数

或者,您可以选择一个周期 N >= n,其中 N 是具有方便数值属性的最小值,并丢弃在 n 和 N-1 之间产生的任何值。例如,最低的 N = 2 k - 1 >= n 将允许您使用线性反馈移位寄存器(LFSR)。或者找到你最喜欢的加密算法(RSA、AES、DES 等)并给定一个特定的密钥,找出它置换的数字的空间 N,并为每一步应用一次加密。

如果 n 很小,但您希望安全性很高,这可能是最棘手的情况,因为任何序列 S 的周期 N 都可能远高于 n,但推导出具有较短周期的非重复数字序列也是不平凡的比 N。(例如,如果您可以获取 S mod n 的输出并保证不重复的数字序列,这将提供攻击者可能使用的有关 S 的信息)

于 2009-01-21T14:14:05.853 回答
3

请参阅我关于使用分组密码的安全排列的文章,了解一种方法。

于 2009-01-23T19:33:35.987 回答
1

查看线性反馈移位寄存器,它们可以用于此目的。解释它们的简短方法是从种子开始,然后使用公式进行迭代

x = (x << 1) | f(x)

其中 f(x) 只能返回 0 或 1。

如果您选择一个好的函数f,x 将以一种好的伪随机方式循环遍历 1 到 2^n-1(其中 n 是某个数字)之间的所有值。可以在此处找到示例函数,例如您可以使用的 63 个值

f(x) = ((x >> 6) & 1) ^ ((x >> 5) & 1)
于 2009-02-05T12:42:19.523 回答