clojure - Clojure 中的快速素数生成

Question

我一直致力于解决Clojure 中的Project Euler问题以变得更好，并且我已经遇到过几次素数生成问题。我的问题是它需要的时间太长了。我希望有人可以帮助我找到一种有效的方法来以 Clojure-y 方式执行此操作。

当我用拳头做这件事时，我是蛮力的。这很容易做到。但是在 Xeon 2.33GHz 上以这种方式计算 10001 个素数需要 2 分钟，这对于规则来说太长了，而且总体上也太长了。这是算法：

(defn next-prime-slow
    "Find the next prime number, checking against our already existing list"
    ([sofar guess]
        (if (not-any? #(zero? (mod guess %)) sofar)
            guess                         ; Then we have a prime
            (recur sofar (+ guess 2)))))  ; Try again                               

(defn find-primes-slow
    "Finds prime numbers, slowly"
    ([]
        (find-primes-slow 10001 [2 3]))   ; How many we need, initial prime seeds
    ([needed sofar]
        (if (<= needed (count sofar))
            sofar                         ; Found enough, we're done
            (recur needed (concat sofar [(next-prime-slow sofar (last sofar))])))))

通过将 next-prime-slow 替换为新的例程，该例程考虑了一些额外的规则（如 6n +/- 1 属性），我能够将速度提高到大约 70 秒。

接下来，我尝试在纯 Clojure 中制作一个 Eratosthenes 筛子。我不认为我把所有的错误都解决了，但我放弃了，因为它太慢了（我认为甚至比上面的还要糟糕）。

(defn clean-sieve
    "Clean the sieve of what we know isn't prime based"
    [seeds-left sieve]
    (if (zero? (count seeds-left))
        sieve              ; Nothing left to filter the list against
        (recur
            (rest seeds-left)    ; The numbers we haven't checked against
            (filter #(> (mod % (first seeds-left)) 0) sieve)))) ; Filter out multiples

(defn self-clean-sieve  ; This seems to be REALLY slow
    "Remove the stuff in the sieve that isn't prime based on it's self"
    ([sieve]
        (self-clean-sieve (rest sieve) (take 1 sieve)))
    ([sieve clean]
        (if (zero? (count sieve))
            clean
            (let [cleaned (filter #(> (mod % (last clean)) 0) sieve)]
                (recur (rest cleaned) (into clean [(first cleaned)]))))))

(defn find-primes
    "Finds prime numbers, hopefully faster"
    ([]
        (find-primes 10001 [2]))
    ([needed seeds]
        (if (>= (count seeds) needed)
            seeds        ; We have enough
            (recur       ; Recalculate
                needed
                (into
                    seeds    ; Stuff we've already found
                    (let [start (last seeds)
                            end-range (+ start 150000)]   ; NOTE HERE
                        (reverse                                                
                            (self-clean-sieve
                            (clean-sieve seeds (range (inc start) end-range))))))))))

这是不好的。如果数字 150000 更小，它也会导致堆栈溢出。尽管我正在使用 recur。那可能是我的错。

接下来我尝试了一个筛子，在 Java ArrayList 上使用 Java 方法。这需要相当多的时间和记忆。

我最近的尝试是使用 Clojure 哈希映射的筛子，将所有数字插入筛子中，然后分解非素数的数字。最后，它获取密钥列表，这是它找到的素数。找到 10000 个素数大约需要 10-12 秒。我不确定它是否已完全调试。它也是递归的（使用递归和循环），因为我想成为 Lispy。

因此，对于这些问题，问题 10（总结 2000000 以下的所有素数）正在杀死我。我最快的代码给出了正确的答案，但它花了 105 秒，并且需要相当多的内存（我给它 512 MB 只是为了不用大惊小怪）。我的其他算法花了很长时间，我总是先停止它们。

我可以使用筛子快速计算 Java 或 C 中的许多素数，而无需使用太多内存。我知道我的 Clojure/Lisp 风格中一定遗漏了一些导致问题的东西。

我做错了什么吗？Clojure 在处理大序列时会有点慢吗？阅读一些 Euler 项目的讨论，人们在 100 毫秒内计算了其他 Lisps 中的前 10000 个素数。我意识到 JVM 可能会减慢速度，而且 Clojure 相对年轻，但我不希望有 100 倍的差异。

有人可以告诉我在 Clojure 中计算素数的快速方法吗？

score 29 · Accepted Answer

这是庆祝的另一种方法Clojure's Java interop。这在 2.4 Ghz Core 2 Duo（运行单线程）上需要 374 毫秒。我让Miller-RabinJava 中的高效实现来BigInteger#isProbablePrime处理素数检查。

(def certainty 5)

(defn prime? [n]
      (.isProbablePrime (BigInteger/valueOf n) certainty))

(concat [2] (take 10001 
   (filter prime? 
      (take-nth 2 
         (range 1 Integer/MAX_VALUE)))))

对于比这大得多的数字，5的Miller-Rabin确定性可能不是很好。确定性等于96.875%确定它是素数 ( 1 - .5^certainty)

score 21 · Accepted Answer

我意识到这是一个非常古老的问题，但我最近最终找到了相同的链接，并且这里的链接不是我想要的（尽可能地限制在函数类型，懒惰地生成〜每一个我想要的素数） .

我偶然发现了一个不错的F# 实现，所以所有的功劳都是他的。我只是将它移植到 Clojure：

(defn gen-primes "Generates an infinite, lazy sequence of prime numbers"
  []
  (letfn [(reinsert [table x prime]
             (update-in table [(+ prime x)] conj prime))
          (primes-step [table d]
             (if-let [factors (get table d)]
               (recur (reduce #(reinsert %1 d %2) (dissoc table d) factors)
                      (inc d))
               (lazy-seq (cons d (primes-step (assoc table (* d d) (list d))
                                              (inc d))))))]
    (primes-step {} 2)))

用法很简单

(take 5 (gen-primes))

score 12 · Accepted Answer

聚会很晚了，但我会举一个例子，使用 Java BitSets：

(defn sieve [n]
  "Returns a BitSet with bits set for each prime up to n"
  (let [bs (new java.util.BitSet n)]
    (.flip bs 2 n)
    (doseq [i (range 4 n 2)] (.clear bs i))
    (doseq [p (range 3 (Math/sqrt n))]
      (if (.get bs p)
        (doseq [q (range (* p p) n (* 2 p))] (.clear bs q))))
    bs))

在 2014 Macbook Pro (2.3GHz Core i7) 上运行它，我得到：

user=> (time (do (sieve 1e6) nil))
"Elapsed time: 64.936 msecs"

score 11 · Accepted Answer

请参阅此处的最后一个示例：http: //clojuredocs.org/clojure_core/clojure.core/lazy-seq

;; An example combining lazy sequences with higher order functions
;; Generate prime numbers using Eratosthenes Sieve
;; See http://en.wikipedia.org/wiki/Sieve_of_Eratosthenes
;; Note that the starting set of sieved numbers should be
;; the set of integers starting with 2 i.e., (iterate inc 2) 
(defn sieve [s]
  (cons (first s)
        (lazy-seq (sieve (filter #(not= 0 (mod % (first s)))
                                 (rest s))))))

user=> (take 20 (sieve (iterate inc 2)))
(2 3 5 7 11 13 17 19 23 29 31 37 41 43 47 53 59 61 67 71)

score 4 · Accepted Answer

这是一个不错且简单的实现：

http://clj-me.blogspot.com/2008/06/primes.html

...但它是为某些 1.0 之前的 Clojure 版本编写的。请参阅Clojure Contrib 中的lazy_seqs，了解适用于当前语言版本的方法。

score 3 · Accepted Answer

(defn sieve
  [[p & rst]]
  ;; make sure the stack size is sufficiently large!
  (lazy-seq (cons p (sieve (remove #(= 0 (mod % p)) rst)))))

(def primes (sieve (iterate inc 2)))

堆栈大小为 10M，我在 2.1Gz macbook 上大约 33 秒内得到第 1001 个素数。

score 3 · Accepted Answer

所以我刚刚开始使用 Clojure，是的，这在 Project Euler 中出现了很多，不是吗？我写了一个非常快的试验除法素数算法，但在每次除法运行变得异常缓慢之前它并没有真正扩展太多。

于是我又开始了，这次使用的是筛法：

(defn clense
  "Walks through the sieve and nils out multiples of step"
  [primes step i]
  (if (<= i (count primes))
    (recur 
      (assoc! primes i nil)
      step
      (+ i step))
    primes))

(defn sieve-step
  "Only works if i is >= 3"
  [primes i]
  (if (< i (count primes))
    (recur
      (if (nil? (primes i)) primes (clense primes (* 2 i) (* i i)))
      (+ 2 i))
    primes))

(defn prime-sieve
  "Returns a lazy list of all primes smaller than x"
  [x]
  (drop 2 
    (filter (complement nil?)
    (persistent! (sieve-step 
      (clense (transient (vec (range x))) 2 4) 3)))))

用法和速度：

user=> (time (do (prime-sieve 1E6) nil))
"Elapsed time: 930.881 msecs

我对速度非常满意：它已经用完了在 2009 MBP 上运行的 REPL。这主要是因为我完全避开了惯用的 Clojure，而是像猴子一样循环。它也快了 4 倍，因为我使用瞬态向量在筛子上工作，而不是保持完全不可变。

编辑：经过 Will Ness 的一些建议/错误修复后，它现在运行得更快了。

score 2 · Accepted Answer

这是 Scheme 中的一个简单筛子：

http://telegraphics.com.au/svn/puzzles/trunk/programming-in-scheme/primes-up-to.scm

这是一个高达 10,000 个素数的运行：

#;1> (include "primes-up-to.scm")
; including primes-up-to.scm ...
#;2> ,t (primes-up-to 10000)
0.238s CPU time, 0.062s GC time (major), 180013 mutations, 130/4758 GCs (major/minor)
(2 3 5 7 11 13...

score 2 · Accepted Answer

这是一个 Clojure 解决方案。i是当前正在考虑的数字，并且p是迄今为止找到的所有素数的列表。如果除以some素数余数为零，则该数i不是素数，并且递归与下一个数一起发生。否则，质数p将在下一次递归中添加（以及继续下一个数字）。

(defn primes [i p]
  (if (some #(zero? (mod i %)) p)
    (recur (inc i) p)
    (cons i (lazy-seq (primes (inc i) (conj p i))))))
(time (do (doall (take 5001 (primes 2 []))) nil))
; Elapsed time: 2004.75587 msecs
(time (do (doall (take 10001 (primes 2 []))) nil))
; Elapsed time: 7700.675118 msecs

更新：这是一个基于上面这个答案的更巧妙的解决方案。基本上，以 2 开头的整数列表会被延迟过滤。i如果没有素数除以余数为零，则仅通过接受一个数字来执行过滤。在素数的平方小于或等于的情况下尝试所有素数i。请注意，它primes是递归使用的，但 Clojure 设法防止无限递归。另请注意，惰性序列primes会缓存结果（这就是性能结果乍一看有点反直觉的原因）。

(def primes
  (lazy-seq
    (filter (fn [i] (not-any? #(zero? (rem i %))
                              (take-while #(<= (* % %) i) primes)))
            (drop 2 (range)))))
(time (first (drop 10000 primes)))
; Elapsed time: 542.204211 msecs
(time (first (drop 20000 primes)))
; Elapsed time: 786.667644 msecs
(time (first (drop 40000 primes)))
; Elapsed time: 1780.15807 msecs
(time (first (drop 40000 primes)))
; Elapsed time: 8.415643 msecs

score 1 · Accepted Answer

根据威尔的评论，这是我的看法postponed-primes：

(defn postponed-primes-recursive
  ([]
     (concat (list 2 3 5 7)
             (lazy-seq (postponed-primes-recursive
                        {}
                        3
                        9
                        (rest (rest (postponed-primes-recursive)))
                        9))))
  ([D p q ps c]
     (letfn [(add-composites
               [D x s]
               (loop [a x]
                 (if (contains? D a)
                   (recur (+ a s))
                   (persistent! (assoc! (transient D) a s)))))]
       (loop [D D
              p p
              q q
              ps ps
              c c]
         (if (not (contains? D c))
           (if (< c q)
             (cons c (lazy-seq (postponed-primes-recursive D p q ps (+ 2 c))))
             (recur (add-composites D
                                    (+ c (* 2 p))
                                    (* 2 p))
                    (first ps)
                    (* (first ps) (first ps))
                    (rest ps)
                    (+ c 2)))
           (let [s (get D c)]
             (recur (add-composites
                     (persistent! (dissoc! (transient D) c))
                     (+ c s)
                     s)
                    p
                    q
                    ps
                    (+ c 2))))))))

初次提交比较：

这是我将这个素数生成器从 Python移植到 Clojure 的尝试。下面返回一个无限的惰性序列。

(defn primes
  []
  (letfn [(prime-help
            [foo bar]
            (loop [D foo
                   q bar]
              (if (nil? (get D q))
                (cons q (lazy-seq
                         (prime-help
                          (persistent! (assoc! (transient D) (* q q) (list q)))
                          (inc q))))
                (let [factors-of-q (get D q)
                      key-val (interleave
                               (map #(+ % q) factors-of-q)
                               (map #(cons % (get D (+ % q) (list)))
                                    factors-of-q))]
                  (recur (persistent!
                          (dissoc!
                           (apply assoc! (transient D) key-val)
                           q))
                         (inc q))))))]
    (prime-help {} 2)))

用法：

user=> (first (primes))
2
user=> (second (primes))
3
user=> (nth (primes) 100)
547
user=> (take 5 (primes))
(2 3 5 7 11)
user=> (time (nth (primes) 10000))
"Elapsed time: 409.052221 msecs"
104743

编辑：

性能比较，其中postponed-primes使用到目前为止看到的素数队列，而不是递归调用postponed-primes：

user=> (def counts (list 200000 400000 600000 800000))
#'user/counts
user=> (map #(time (nth (postponed-primes) %)) counts)
("Elapsed time: 1822.882 msecs"
 "Elapsed time: 3985.299 msecs"
 "Elapsed time: 6916.98 msecs"
 "Elapsed time: 8710.791 msecs"
2750161 5800139 8960467 12195263)
user=> (map #(time (nth (postponed-primes-recursive) %)) counts)
("Elapsed time: 1776.843 msecs"
 "Elapsed time: 3874.125 msecs"
 "Elapsed time: 6092.79 msecs"
 "Elapsed time: 8453.017 msecs"
2750161 5800139 8960467 12195263)

score 1 · Accepted Answer

惯用语，而且还不错

(def primes
  (cons 1 (lazy-seq
            (filter (fn [i]
                      (not-any? (fn [p] (zero? (rem i p)))
                                (take-while #(<= % (Math/sqrt i))
                                            (rest primes))))
                    (drop 2 (range))))))
=> #'user/primes
(first (time (drop 10000 primes)))
"Elapsed time: 0.023135 msecs"
=> 104729

score 0 · Accepted Answer

我刚开始使用 Clojure，所以我不知道它是否好，但这是我的解决方案：

(defn divides? [x i]
  (zero? (mod x i)))

(defn factors [x]
    (flatten (map #(list % (/ x %)) 
                 (filter #(divides? x %) 
                        (range 1 (inc (Math/floor (Math/sqrt x))))))))

(defn prime? [x]
  (empty? (filter #(and divides? (not= x %) (not= 1 %)) 
                 (factors x))))

(def primes 
  (filter prime? (range 2 java.lang.Integer/MAX_VALUE)))

(defn sum-of-primes-below [n]
  (reduce + (take-while #(< % n) primes)))

score 0 · Accepted Answer

来自：http ://steloflute.tistory.com/entry/Clojure-%ED%94%84%EB%A1%9C%EA%B7%B8%EB%9E%A8-%EC%B5%9C%EC% A0%81%ED%99%94

使用 Java 数组

(defmacro loopwhile [init-symbol init whilep step & body]
  `(loop [~init-symbol ~init]
     (when ~whilep ~@body (recur (+ ~init-symbol ~step)))))

(defn primesUnderb [limit]
  (let [p (boolean-array limit true)]
    (loopwhile i 2 (< i (Math/sqrt limit)) 1
               (when (aget p i)
                 (loopwhile j (* i 2) (< j limit) i (aset p j false))))
    (filter #(aget p %) (range 2 limit))))

用法和速度：

user=> (time (def p (primesUnderb 1e6)))
"Elapsed time: 104.065891 msecs"

score 0 · Accepted Answer

如果您不需要惰性解决方案，并且只需要低于某个限制的素数序列，那么埃拉托色尼筛法的直接实现非常快。这是我使用瞬变的版本：

(defn classic-sieve
  "Returns sequence of primes less than N"
  [n]
  (loop [nums (transient (vec (range n))) i 2]
    (cond
     (> (* i i) n) (remove nil? (nnext (persistent! nums)))
     (nums i) (recur (loop [nums nums j (* i i)]
                       (if (< j n)
                         (recur (assoc! nums j nil) (+ j i))
                         nums))
                     (inc i))
     :else (recur nums (inc i)))))

score 0 · Accepted Answer

在来到这个帖子并寻找比已经在这里的人更快的替代品之后，我很惊讶没有人链接到Christophe Grand 的以下文章：

(defn primes3 [max]
  (let [enqueue (fn [sieve n factor]
                  (let [m (+ n (+ factor factor))]
                    (if (sieve m)
                      (recur sieve m factor)
                      (assoc sieve m factor))))
        next-sieve (fn [sieve candidate]
                     (if-let [factor (sieve candidate)]
                       (-> sieve
                         (dissoc candidate)
                         (enqueue candidate factor))
                       (enqueue sieve candidate candidate)))]
    (cons 2 (vals (reduce next-sieve {} (range 3 max 2))))))

以及一个懒惰的版本：

(defn lazy-primes3 []
  (letfn [(enqueue [sieve n step]
            (let [m (+ n step)]
              (if (sieve m)
                (recur sieve m step)
                (assoc sieve m step))))
          (next-sieve [sieve candidate]
            (if-let [step (sieve candidate)]
              (-> sieve
                (dissoc candidate)
                (enqueue candidate step))
              (enqueue sieve candidate (+ candidate candidate))))
          (next-primes [sieve candidate]
            (if (sieve candidate)
              (recur (next-sieve sieve candidate) (+ candidate 2))
              (cons candidate 
                (lazy-seq (next-primes (next-sieve sieve candidate) 
                            (+ candidate 2))))))]
    (cons 2 (lazy-seq (next-primes {} 3)))))

score 0 · Accepted Answer

已经有很多答案了，但我有一个替代解决方案可以生成无限的素数序列。我也有兴趣对一些解决方案进行基准测试。

首先是一些 Java 互操作。以供参考：

(defn prime-fn-1 [accuracy]
  (cons 2
    (for [i (range)
          :let [prime-candidate (-> i (* 2) (+ 3))]
          :when (.isProbablePrime (BigInteger/valueOf prime-candidate) accuracy)]
      prime-candidate)))

本杰明@https ://stackoverflow.com/a/7625207/3731823是primes-fn-2

nha @ https://stackoverflow.com/a/36432061/3731823是primes-fn-3

我的实现是primes-fn-4：

(defn primes-fn-4 []
  (let [primes-with-duplicates
         (->> (for [i (range)] (-> i (* 2) (+ 5))) ; 5, 7, 9, 11, ...
              (reductions
                (fn [known-primes candidate]
                  (if (->> known-primes
                           (take-while #(<= (* % %) candidate))
                           (not-any?   #(-> candidate (mod %) zero?)))
                   (conj known-primes candidate)
                   known-primes))
                [3])     ; Our initial list of known odd primes
              (cons [2]) ; Put in the non-odd one
              (map (comp first rseq)))] ; O(1) lookup of the last element of the vec "known-primes"

    ; Ugh, ugly de-duplication :(
    (->> (map #(when (not= % %2) %) primes-with-duplicates (rest primes-with-duplicates))
         (remove nil?))))

报告的数字（以毫秒为单位计算前 N 个素数的时间）是 5 次运行中最快的，实验之间没有 JVM 重新启动，因此您的里程可能会有所不同：

                     1e6      3e6

(primes-fn-1  5)     808     2664
(primes-fn-1 10)     952     3198
(primes-fn-1 20)    1440     4742
(primes-fn-1 30)    1881     6030
(primes-fn-2)       1868     5922
(primes-fn-3)        489     1755  <-- WOW!
(primes-fn-4)       2024     8185

clojure - Clojure 中的快速素数生成

16 回答 16

Related

Reference