分段筛的基本思想是选择小于n的平方根的筛分素数,选择一个相当大但仍适合内存的片段大小,然后依次筛选每个片段,从最小的片段开始。在第一段,计算段内每个筛素的最小倍数,然后以正常方式将筛素的倍数标记为合数;当所有的筛选素数都用完后,该段中剩余的未标记数是素数。然后,对于下一个片段,对于每个筛分素数,您已经知道当前片段中的第一个倍数(它是结束前片段中那个素数的筛分的倍数),所以您在每个筛分素数上进行筛分,依此类推直到你完成。
n的大小无关紧要,只是较大的n比较小的n需要更长的筛分时间;重要的是段的大小,它应该尽可能大(例如,机器上主内存缓存的大小)。
您可以在此处查看分段筛的简单实现。请注意,分段筛将比另一个答案中提到的 O'Neill 的优先队列筛快得多;如果你有兴趣,这里有一个实现。
编辑:我写这个是为了不同的目的,但我会在这里展示它,因为它可能有用:
尽管埃拉托色尼筛法非常快,但它需要 O(n) 空间。通过在连续的段中执行筛选,这可以减少到筛选素数的 O(sqrt(n)) 加上位数组的 O(1)。在第一段,计算段内每个筛素的最小倍数,然后以正常方式将筛素的倍数标记为合数;当所有的筛选素数都用完后,该段中剩余的未标记数是素数。然后,对于下一段,每个筛分素数的最小倍数是在前一段中结束筛分的倍数,因此筛分一直持续到完成。
考虑在 20 段中从 100 到 200 筛分的示例。五个筛分素数是 3、5、7、11 和 13。在从 100 到 120 的第一段中,位数组有十个槽,槽 0 对应于 101 ,slot k对应100+2k+1,slot 9对应119。segment中3的最小倍数是105,对应slot 2;槽 2+3=5 和 5+3=8 也是 3 的倍数。槽 2 处 5 的最小倍数是 105,槽 2+5=7 也是 5 的倍数。7 的最小倍数是 105在插槽 2 处,插槽 2+7=9 也是 7 的倍数。以此类推。
函数 primesRange 接受参数 lo、hi 和 delta;lo 和 hi 必须是偶数,lo < hi,并且 lo 必须大于 sqrt(hi)。段大小是 delta 的两倍。Ps 是一个链表,其中包含小于 sqrt(hi) 的筛选素数,由于偶数被忽略,因此删除了 2。Qs 是一个链表,包含在相应筛选素数的当前段中的最小倍数的筛位数组中的offest。在每个段之后,lo 前进两倍 delta,因此筛位数组的索引 i 对应的数字是 lo + 2i + 1。
function primesRange(lo, hi, delta)
function qInit(p)
return (-1/2 * (lo + p + 1)) % p
function qReset(p, q)
return (q - delta) % p
sieve := makeArray(0..delta-1)
ps := tail(primes(sqrt(hi)))
qs := map(qInit, ps)
while lo < hi
for i from 0 to delta-1
sieve[i] := True
for p,q in ps,qs
for i from q to delta step p
sieve[i] := False
qs := map(qReset, ps, qs)
for i,t from 0,lo+1 to delta-1,hi step 1,2
if sieve[i]
output t
lo := lo + 2 * delta
当调用 primesRange(100, 200, 10) 时,筛选素数 ps 为 [3, 5, 7, 11, 13];qs 最初是 [2, 2, 2, 10, 8] 对应于最小的倍数 105, 105, 105, 121 和 117,并且对于第二段重置为 [1, 2, 6, 0, 11] 对应于最小123、125、133、121 和 143 的倍数。
您可以在以下位置查看此程序的运行情况http://ideone.com/iHYr1f。除了上面显示的链接之外,如果您对使用素数进行编程感兴趣,我会在我的博客上谦虚地推荐这篇文章。