haskell - 哈斯克尔的埃拉托色尼筛

Question

我正在解决 Haskell 中的一些经典问题以发展我的功能技能，并且在实施此“Programming Praxis”站点上建议的优化时遇到问题：

对于这个问题，我有三种解决方案，与第二种解决方案相比，第三种方法太慢了。有人可以建议对我的代码进行一些改进吗？

我的实现是：

-- primeira implementação
primes n
    | n < 2 = []
    | n == 2 = [2]
    | n `mod` 2 == 0 = primes'
    | otherwise = if (find (\x -> n `mod` x == 0) primes') == Nothing then
                      n:primes'
                  else
                      primes'
    where primes' = primes (n - 1)

-- segunda implementação
primes' :: Integer -> [Integer]
primes' n = sieve $ 2 : [3,5..n]
    where sieve :: [Integer] -> [Integer]
          sieve [] = []
          sieve l@(x:xs)
              | x*x >= n = l
              | otherwise = x : sieve list'
              where list' = filter (\y -> y `mod` x /= 0) xs

-- terceira implementação
primes'' :: Integer -> [Integer]
primes'' n = 2 : sieve 3 [3,5..n]
    where sieve :: Integer -> [Integer] -> [Integer]
          sieve _ [] = []
          sieve m l@(x:xs)
              | m*m >= n = l
              | x < m*m = x : sieve m xs
              | otherwise = sieve (m + 2) list'
              where list'= filter (\y -> y `mod` m /= 0) l

score 6 · Accepted Answer

首先，mod速度很慢，因此rem在无关紧要的情况下使用（基本上，当您不处理底片时）。其次，使用Criterion向自己展示（向自己）什么更快，什么变化实际上是优化。我知道我没有就此问题给出完整的答案，但它是您（和其他潜在回答者）开始的好地方，所以这里有一些代码：

import List
import Criterion.Main

main = do
  str <- getLine
  let run f = length . f
      input = read str :: Integer
  defaultMain   [ bench "primes" (nf (run primes) input)
                , bench "primes'" (nf (run primes') input)
                , bench "primes''" (nf (run primes'') input)
                , bench "primesTMD" (nf (run primesTMD) input)
                , bench "primes'TMD" (nf (run primes'TMD) input)
                , bench "primes''TMD" (nf (run primes''TMD) input)
                ]
  putStrLn . show . length . primes'' $ (read str :: Integer)

-- primeira implementação
primes n
    | n < 2 = []
    | n == 2 = [2]
    | n `mod` 2 == 0 = primes'
    | otherwise = if (find (\x -> n `mod` x == 0) primes') == Nothing then
                      n:primes'
                  else
                      primes'
    where primes' = primes (n - 1)

primesTMD n
    | n < 2 = []
    | n == 2 = [2]
    | n `mod` 2 == 0 = primes'
    | otherwise = if (find (\x -> n `rem` x == 0) primes') == Nothing then
                      n:primes'
                  else
                      primes'
    where primes' = primesTMD (n - 1)

-- segunda implementação
primes' :: Integer -> [Integer]
primes' n = sieve $ 2 : [3,5..n]
    where sieve :: [Integer] -> [Integer]
          sieve [] = []
          sieve l@(x:xs)
              | x*x >= n = l
              | otherwise = x : sieve list'
              where list' = filter (\y -> y `mod` x /= 0) xs

primes'TMD :: Integer -> [Integer]
primes'TMD n = sieve $ 2 : [3,5..n]
    where sieve :: [Integer] -> [Integer]
          sieve [] = []
          sieve l@(x:xs)
              | x*x >= n = l
              | otherwise = x : sieve list'
              where list' = filter (\y -> y `rem` x /= 0) xs

-- terceira implementação
primes'' :: Integer -> [Integer]
primes'' n = 2 : sieve 3 [3,5..n]
    where sieve :: Integer -> [Integer] -> [Integer]
          sieve _ [] = []
          sieve m l@(x:xs)
              | m*m >= n = l
              | x < m*m = x : sieve m xs
              | otherwise = sieve (m + 2) list'
              where list'= filter (\y -> y `mod` m /= 0) l

primes''TMD :: Integer -> [Integer]
primes''TMD n = 2 : sieve 3 [3,5..n]
    where sieve :: Integer -> [Integer] -> [Integer]
          sieve _ [] = []
          sieve m l@(x:xs)
              | m*m >= n = l
              | x < m*m = x : sieve m xs
              | otherwise = sieve (m + 2) list'
              where list'= filter (\y -> y `rem` m /= 0) l

请注意改进的变体运行时使用rem：

 $ ghc --make -O2 sieve.hs
 $./sieve
 5000
 ...
 benchmarking primes 
 mean: 23.88546 ms, lb 23.84035 ms, ub 23.95000 ms

 benchmarking primes'
 mean: 775.9981 us, lb 775.4639 us, ub 776.7081 us

 benchmarking primes''
 mean: 837.7901 us, lb 836.7824 us, ub 839.0260 us

 benchmarking primesTMD
 mean: 16.15421 ms, lb 16.11955 ms, ub 16.19202 ms

 benchmarking primes'TMD
 mean: 568.9857 us, lb 568.5819 us, ub 569.4641 us

 benchmarking primes''TMD
 mean: 642.5665 us, lb 642.0495 us, ub 643.4105 us

虽然我看到您这样做是为了自己的教育，但值得注意的是 Haskell.org 上Primes 的相关链接和 hackage 上的快速Primes 包。

score 6 · Accepted Answer

在我看来，您第三次修订的问题在于您如何选择要筛选的下一个元素。您不加选择地增加 2。问题是您随后会筛选出不必要的数字。例如，在这个版本中，您最终会将 9 作为 m 传递，并且您将进行额外的递归以过滤 9，即使它甚至不在列表中，因此您不应该选择它第一名（因为它会在 3 的第一个过滤器中被删除）

即使第二个版本没有开始过滤超过它筛选的数字的平方，它也从不选择不必要的筛选值。

换句话说，我认为你最终会筛选 3 到 n 之间的每个奇数。相反，您应该筛选尚未被前一次传递删除的每个奇数。

我认为要正确实现以当前筛选值的平方启动筛子的优化，您必须保留列表的前面，同时在后面筛选，其中后面包含元素 >= 筛选值的平方。我认为这会迫使您使用串联，而且我不太确定优化是否足以抵消使用 ++ 引起的开销。

score 1 · Accepted Answer

这不是优化但富有表现力的实现：查看 Haskell 中 Eratosthenes 的视频 Sieve

import qualified Data.Set as Set(fromList,difference)
kr n l = (*n) <$> [2..l `div` n]
g n = difference (fromList [2..n]) (fromList $ concat $ ((flip kr) n) <$> [2..n])

haskell - 哈斯克尔的埃拉托色尼筛

3 回答 3

Related

Reference