作为练习,我在Darren Wilkinson的博客文章Gibbs sampler 中用各种语言(重新访问)重写了示例程序。
代码如下所示。这段代码在我(5 岁的)机器上运行大约 53 秒,使用 SBCL 1.0.56,使用 buildapp 创建核心映像,然后运行它
time ./gibbs > gibbs.dat
因为这是计算帖子中其他语言的时间的方式,所以我想我会做一些类似的事情。帖子中的 C 代码运行大约 25 秒。如果可能的话,我想尝试加速 Lisp 代码。
##############################
gibbs.lisp
##############################
(eval-when (:compile-toplevel :load-toplevel :execute)
(require :cl-rmath) (setf *read-default-float-format* 'double-float))
(defun gibbs (N thin)
(declare (fixnum N thin))
(declare (optimize (speed 3) (safety 1)))
(let ((x 0.0) (y 0.0))
(declare (double-float x y))
(print "Iter x y")
(dotimes (i N)
(dotimes (j thin)
(declare (fixnum i j))
(setf x (cl-rmath::rgamma 3.0 (/ 1.0 (+ (* y y) 4))))
(setf y (cl-rmath::rnorm (/ 1.0 (+ x 1.0)) (/ 1.0 (sqrt (+ (* 2 x) 2))))))
(format t "~a ~a ~a~%" i x y))))
(defun main (argv)
(declare (ignore argv))
(gibbs 50000 1000))
然后我用asgibbs
调用构建了可执行文件sh gibbs.sh
gibbs.sh
##################
gibbs.sh
##################
buildapp --output gibbs --asdf-tree /usr/share/common-lisp/source/ --asdf-tree /usr/local/share/common-lisp/source/ --load-system cl-rmath --load gibbs.lisp --entry main
使用 SBCL 1.0.56 进行编译时,我得到了 6 个编译器注释,它们在下面重现。我不知道该怎么处理他们,但会感谢任何提示。
; compiling file "/home/faheem/lisp/gibbs.lisp" (written 30 MAY 2012 02:00:55 PM):
; file: /home/faheem/lisp/gibbs.lisp
; in: DEFUN GIBBS
; (SQRT (+ (* 2 X) 2))
;
; note: unable to
; optimize
; due to type uncertainty:
; The result is a (VALUES (OR (DOUBLE-FLOAT 0.0) (COMPLEX DOUBLE-FLOAT))
; &OPTIONAL), not a (VALUES FLOAT &REST T).
; (/ 1.0d0 (SQRT (+ (* 2 X) 2)))
;
; note: unable to
; optimize
; due to type uncertainty:
; The second argument is a (OR (DOUBLE-FLOAT 0.0)
; (COMPLEX DOUBLE-FLOAT)), not a (COMPLEX
; DOUBLE-FLOAT).
;
; note: forced to do static-fun Two-arg-/ (cost 53)
; unable to do inline float arithmetic (cost 12) because:
; The second argument is a (OR (DOUBLE-FLOAT 0.0) (COMPLEX DOUBLE-FLOAT)), not a DOUBLE-FLOAT.
; The result is a (VALUES (OR (COMPLEX DOUBLE-FLOAT) (DOUBLE-FLOAT 0.0))
; &OPTIONAL), not a (VALUES DOUBLE-FLOAT &REST T).
; (CL-RMATH:RGAMMA 3.0d0 (/ 1.0d0 (+ (* Y Y) 4)))
;
; note: doing float to pointer coercion (cost 13)
; (SQRT (+ (* 2 X) 2))
;
; note: doing float to pointer coercion (cost 13)
; (CL-RMATH:RNORM (/ 1.0d0 (+ X 1.0d0)) (/ 1.0d0 (SQRT (+ (* 2 X) 2))))
;
; note: doing float to pointer coercion (cost 13)
;
; compilation unit finished
; printed 6 notes
; /home/faheem/lisp/gibbs.fasl written
; compilation finished in 0:00:00.073
更新 1:Rainer Joswig 的回答指出 SQRT 的参数可能是否定的,这是我看到的晦涩编译器注释的来源,即
The result is a (VALUES (OR (DOUBLE-FLOAT 0.0) (COMPLEX DOUBLE-FLOAT))
; &OPTIONAL), not a (VALUES FLOAT &REST T).
编译器抱怨说,由于它不知道参数的值是否为正,结果可能是一个复数。由于在示例中,该值x
是来自 gamma 分布的样本变量,因此它始终大于 0。Stephan 在 SBCL 用户邮件列表中很有帮助地指出了这一点,(请参阅线程“优化简单的 Common Lisp”中的第二条消息Gibbs 采样程序”,这可以通过声明 x 大于或零来解决,如下所示,
(declare (type (double-float 0.0 *) x))
有关FLOAT 类型 和 间隔指示符的相关文档,请参阅 Common Lisp Hyperspec 。
这似乎加快了代码速度。它现在可靠地低于 52 秒,但仍然没有太大的进步。这也留下了关于
note: doing float to pointer coercion (cost 13)
如果由于某种原因无法修复,我想知道原因。此外,无论如何,对注释含义的解释会很有趣。具体来说,这个词pointer
在这里是什么意思?这与调用 C 函数的事实有关吗?此外,成本 13 似乎不是很有用。正在测量什么?
此外,Rainer 建议可以减少 consing,这可能会减少运行时间。我不知道是否可以减少 consing,或者是否会减少运行时间,但我会对意见和方法感兴趣。总体而言,似乎没有太多可以提高此功能的性能。也许它太小太简单了。