6

作为练习,我在Darren Wilkinson的博客文章Gibbs sampler 中用各种语言(重新访问)重写了示例程序。

代码如下所示。这段代码在我(5 岁的)机器上运行大约 53 秒,使用 SBCL 1.0.56,使用 buildapp 创建核心映像,然后运行它

time ./gibbs > gibbs.dat

因为这是计算帖子中其他语言的时间的方式,所以我想我会做一些类似的事情。帖子中的 C 代码运行大约 25 秒。如果可能的话,我想尝试加速 Lisp 代码。

##############################
gibbs.lisp
##############################
(eval-when (:compile-toplevel :load-toplevel :execute)
  (require :cl-rmath) (setf *read-default-float-format* 'double-float))

(defun gibbs (N thin)
  (declare (fixnum N thin))
  (declare (optimize (speed 3) (safety 1)))
  (let ((x 0.0) (y 0.0))
    (declare (double-float x y))
    (print "Iter x y")
    (dotimes (i N)
      (dotimes (j thin)
    (declare (fixnum i j))
    (setf x (cl-rmath::rgamma 3.0 (/ 1.0 (+ (* y y) 4))))
    (setf y (cl-rmath::rnorm (/ 1.0 (+ x 1.0)) (/ 1.0 (sqrt (+ (* 2 x) 2))))))
      (format t "~a ~a ~a~%" i x y))))

(defun main (argv)
  (declare (ignore argv))
  (gibbs 50000 1000))

然后我用asgibbs调用构建了可执行文件sh gibbs.shgibbs.sh

##################
gibbs.sh
##################
buildapp --output gibbs --asdf-tree /usr/share/common-lisp/source/ --asdf-tree /usr/local/share/common-lisp/source/ --load-system cl-rmath --load gibbs.lisp --entry main

使用 SBCL 1.0.56 进行编译时,我得到了 6 个编译器注释,它们在下面重现。我不知道该怎么处理他们,但会感谢任何提示。

; compiling file "/home/faheem/lisp/gibbs.lisp" (written 30 MAY 2012 02:00:55 PM):

; file: /home/faheem/lisp/gibbs.lisp
; in: DEFUN GIBBS
;     (SQRT (+ (* 2 X) 2))
; 
; note: unable to
;   optimize
; due to type uncertainty:
;   The result is a (VALUES (OR (DOUBLE-FLOAT 0.0) (COMPLEX DOUBLE-FLOAT))
;                           &OPTIONAL), not a (VALUES FLOAT &REST T).

;     (/ 1.0d0 (SQRT (+ (* 2 X) 2)))
; 
; note: unable to
;   optimize
; due to type uncertainty:
;   The second argument is a (OR (DOUBLE-FLOAT 0.0)
;                                (COMPLEX DOUBLE-FLOAT)), not a (COMPLEX
;                                                                DOUBLE-FLOAT).
; 
; note: forced to do static-fun Two-arg-/ (cost 53)
;       unable to do inline float arithmetic (cost 12) because:
;       The second argument is a (OR (DOUBLE-FLOAT 0.0) (COMPLEX DOUBLE-FLOAT)), not a DOUBLE-FLOAT.
;       The result is a (VALUES (OR (COMPLEX DOUBLE-FLOAT) (DOUBLE-FLOAT 0.0))
;                               &OPTIONAL), not a (VALUES DOUBLE-FLOAT &REST T).

;     (CL-RMATH:RGAMMA 3.0d0 (/ 1.0d0 (+ (* Y Y) 4)))
; 
; note: doing float to pointer coercion (cost 13)

;     (SQRT (+ (* 2 X) 2))
; 
; note: doing float to pointer coercion (cost 13)

;     (CL-RMATH:RNORM (/ 1.0d0 (+ X 1.0d0)) (/ 1.0d0 (SQRT (+ (* 2 X) 2))))
; 
; note: doing float to pointer coercion (cost 13)
; 
; compilation unit finished
;   printed 6 notes

; /home/faheem/lisp/gibbs.fasl written
; compilation finished in 0:00:00.073

更新 1:Rainer Joswig 的回答指出 SQRT 的参数可能是否定的,这是我看到的晦涩编译器注释的来源,即

The result is a (VALUES (OR (DOUBLE-FLOAT 0.0) (COMPLEX DOUBLE-FLOAT))
    ;                           &OPTIONAL), not a (VALUES FLOAT &REST T).

编译器抱怨说,由于它不知道参数的值是否为正,结果可能是一个复数。由于在示例中,该值x是来自 gamma 分布的样本变量,因此它始终大于 0。Stephan 在 SBCL 用户邮件列表中很有帮助地指出了这一点,(请参阅线程“优化简单的 Common Lisp”中的第二条消息Gibbs 采样程序”,这可以通过声明 x 大于或零来解决,如下所示,

(declare (type (double-float 0.0 *) x))

有关FLOAT 类型间隔指示符的相关文档,请参阅 Common Lisp Hyperspec 。

这似乎加快了代码速度。它现在可靠地低于 52 秒,但仍然没有太大的进步。这也留下了关于

note: doing float to pointer coercion (cost 13)

如果由于某种原因无法修复,我想知道原因。此外,无论如何,对注释含义的解释会很有趣。具体来说,这个词pointer在这里是什么意思?这与调用 C 函数的事实有关吗?此外,成本 13 似乎不是很有用。正在测量什么?

此外,Rainer 建议可以减少 consing,这可能会减少运行时间。我不知道是否可以减少 consing,或者是否会减少运行时间,但我会对意见和方法感兴趣。总体而言,似乎没有太多可以提高此功能的性能。也许它太小太简单了。

4

2 回答 2

4

请注意,Common Lisp 有一个THE特殊运算符。它允许您声明表达式结果的类型。例如,这允许您尽可能缩小类型。

例如,结果是(SQRT somefloat)什么?它可以是浮点数,但如果somefloat为负数,它可能是复数。如果你知道 somefloat 总是积极的(而且只有这样),那么你可以写(the double-float (sqrt somefloat)). 然后编译器可能能够生成更高效的代码。

另请注意,Common Lisp 有OPTIMIZE声明。如果您想要最快的代码,您需要确保相应地设置它们。可能仅适用于个别功能。通常它比全局更改优化要非常积极。

Common Lisp 有一个函数DISASSEMBLE可以让你查看编译后的代码。

然后是宏TIME。您从中获得的有趣信息包括它做了多少 consing。使用双浮点算术可能会有大量的 consing。在 SBCL 邮件列表上寻求帮助会很有用。也许有人可以告诉你如何避免这种骗局。

于 2012-05-30T09:30:54.740 回答
2

这对我有用:

(sqrt (the (double-float 0d0) (+ (* 2d0 x) 2d0)))
于 2012-05-31T05:07:11.027 回答