5

序幕

其中Raku有一个名为infinite listAKA的概念lazy list,其定义和使用如下:

my @inf = (1,2,3 ... Inf);
for @inf { say $_;
           exit if $_ == 7 }
# => OUTPUT
1
2
3
4
5
6
7

我想在 Common Lisp 中实现这种东西,特别是一个无限的连续整数列表,例如:

(defun inf (n)
  ("the implementation"))

这样

(inf 5)
=> (5 6 7 8 9 10 .... infinity)
;; hypothetical output just for the demo purposes. It won't be used in reality

然后我将使用它进行惰性评估,如下所示:

(defun try () ;; catch and dolist 
  (catch 'foo ;; are just for demo purposes
    (dolist (n (inf 1) 'done)
      (format t "~A~%" n)
      (when (= n 7)
    (throw 'foo x)))))

CL-USER> (try)
1
2
3
4
5
6
7
; Evaluation aborted.

如何以最实用的方式在 CL 中实现这样的无限列表?

4

3 回答 3

5

一个好的教学方法是定义有时被称为“流”的事物。我所知道的关于这样做的最好的介绍是计算机程序的结构和解释。流在第 3.5 节中介绍,但不要仅仅阅读:认真阅读这本书:这是一本每个对编程感兴趣的人都应该阅读的书。

SICP使用Scheme,这种东西在Scheme中更自然。但它可以在 CL 中相当容易地完成。我在下面写的是相当“Schemy”的 CL:特别是我只是假设尾调用是优化的。这在 CL 中不是一个安全的假设,但是如果您的语言能够胜任,那么看看如何将这些概念构建到一种还没有它们的语言中就足够了。

首先,我们需要一个支持惰性评估的构造:我们需要能够“延迟”某些东西以创建一个“承诺”,该承诺仅在需要时才被评估。好吧,函数所做的只是在被要求时才评估它们的身体,所以我们将使用它们:

(defmacro delay (form)
  (let ((stashn (make-symbol "STASH"))
        (forcedn (make-symbol "FORCED")))
    `(let ((,stashn nil)
           (,forcedn nil))
       (lambda ()
         (if ,forcedn
             ,stashn
           (setf ,forcedn t
                 ,stashn ,form))))))

(defun force (thing)
  (funcall thing))

delay有点繁琐,它想确保一个承诺只被强制执行一次,并且它还想确保被延迟的表单不会被它用来执行此操作的状态所感染。您可以跟踪 的扩展delay以查看它的作用:

(delay (print 1))
 -> (let ((#:stash nil) (#:forced nil))
      (lambda ()
        (if #:forced #:stash (setf #:forced t #:stash (print 1)))))

这可以。

所以现在,我们将发明流:流就像 conses(它们是 conses!)但它们的 cdr 是延迟的:

(defmacro cons-stream (car cdr)
  `(cons ,car (delay ,cdr)))

(defun stream-car (s)
  (car s))

(defun stream-cdr (s)
  (force (cdr s)))

好的,让我们编写一个函数来获取流的第 n 个元素:

(defun stream-nth (n s)
  (cond ((null s)
         nil)
        ((= n 0) (stream-car s))
        (t
         (stream-nth (1- n) (stream-cdr s)))))

我们可以测试一下:

> (stream-nth 2
              (cons-stream 0 (cons-stream 1 (cons-stream 2 nil))))
2

现在我们可以编写一个函数来枚举自然数中的一个区间,默认情况下它将是一个半无限区间:

(defun stream-enumerate-interval (low &optional (high nil))
  (if (and high (> low high))
      nil
      (cons-stream
       low
       (stream-enumerate-interval (1+ low) high))))

现在:

> (stream-nth 1000 (stream-enumerate-interval 0))
1000

等等。

好吧,我们想要某种可以让我们遍历流的宏:类似于dolist, 但用于流。好吧,我们可以通过首先编写一个函数来为流中的每个元素调用一个函数来做到这一点(这不是我在生产 CL 代码中这样做的方式,但在这里很好):

(defun call/stream-elements (f s)
  ;; Call f on the elements of s, returning NIL
  (if (null s)
      nil
    (progn
      (funcall f (stream-car s))
      (call/stream-elements f (stream-cdr s)))))

现在

(defmacro do-stream ((e s &optional (r 'nil)) &body forms)
  `(progn
     (call/stream-elements (lambda (,e)
                             ,@forms)
                           ,s)
     ,r))

现在,例如

(defun look-for (v s)
  ;; look for an element of S which is EQL to V
  (do-stream (e s (values nil nil))
    (when (eql e v)
      (return-from look-for (values e t)))))

然后我们可以说

> (look-for 100 (stream-enumerate-interval 0))
100
t

好吧,要使流真正有用,您还需要更多机制:您需要能够组合它们、附加它们等等。SICP有很多这样的功能,一般很容易转成CL,但是这里太长了。

于 2021-01-22T11:46:11.550 回答
4

出于实际目的,使用现有库是明智的,但由于问题是关于如何实现惰性列表,我们将从头开始。

闭包

惰性迭代是指生成一个对象,该对象在每次被请求时都可以生成惰性序列的新值。一个简单的方法是返回一个闭包,即一个关闭变量的函数,它在通过副作用更新其状态的同时产生值。

如果您评估:

(let ((a 0))
  (lambda () (incf a)))

您获得了一个具有局部状态的函数对象,即此处名为 的变量a。这是对该函数专有位置的词法绑定,如果您第二次评估相同的表达式,您将获得一个不同的匿名函数,该函数具有自己的本地状态。

当您调用闭包时,存储a在增量中的值并返回其值。

让我们将此闭包绑定到一个名为 的变量counter,多次调用它并将连续的结果存储在一个列表中:

(let ((counter (let ((a 0))
                 (lambda () (incf a)))))
  (list (funcall counter)
        (funcall counter)
        (funcall counter)
        (funcall counter)))

结果列表是:

(1 2 3 4)

简单的迭代器

在您的情况下,您希望在编写时有一个从 5 开始计数的迭代器:

(inf 5)

这可以实现如下:

(defun inf (n)
  (lambda ()
    (shiftf n (1+ n))))

这里不需要添加 a let,参数的词法绑定n是在调用函数时完成的。n随着时间的推移,我们在体内分配不同的值。更准确地说,SHIFTF分配n(1+ n),但返回 的前一个值n。例如:

(let ((it (inf 5)))
  (list (funcall it)
        (funcall it)
        (funcall it)
        (funcall it)))

这使:

(5 6 7 8)

泛型迭代器

该标准dolist需要一个正确的列表作为输入,您无法放置另一种数据并期望它能够工作(或者可能以特定于实现的方式)。我们需要一个类似的宏来迭代任意迭代器中的所有值。我们还需要指定迭代停止的时间。这里有多种可能,让我们定义一个基本的迭代协议如下:

  1. 我们可以调用make-iterator任何对象以及任意参数来获取迭代器
  2. 我们可以调用next一个迭代器来获取下一个值。
  3. 更准确地说,如果有值,则next返回该值和 T 作为辅助值;否则,next返回 NIL。

让我们定义两个通用函数:

(defgeneric make-iterator (object &key)
  (:documentation "create an iterator for OBJECT and arguments ARGS"))

(defgeneric next (iterator)
  (:documentation "returns the next value and T as a secondary value, or NIL"))

使用泛型函数允许用户定义自定义迭代器,只要它们尊重上述指定的行为。

我们没有使用仅适用于急切序列的 using dolist,而是定义了自己的宏:formake-iterator它隐藏了与next用户之间的呼叫。换句话说,for获取一个对象并对其进行迭代。我们可以跳过迭代,(return v)因为for是用 实现的loop

(defmacro for ((value object &rest args) &body body)
  (let ((it (gensym)) (exists (gensym)))
    `(let ((,it  (make-iterator ,object ,@args)))
       (loop
         (multiple-value-bind (,value ,exists) (next ,it)
           (unless ,exists
             (return))
           ,@body)))))

我们假设任何函数对象都可以充当迭代器,因此我们专门针对classnext的值,以便调用该函数:ffunctionf

(defmethod next ((f function))
  "A closure is an interator"
  (funcall f))

此外,我们还可以专门make-iterator使闭包成为自己的迭代器(我没有看到其他好的默认行为可以为闭包提供):

(defmethod make-iterator ((function function) &key)
  function)

向量迭代器

例如,我们可以为向量构建一个迭代器,如下所示。我们专注make-iterator于 class 的值(这里命名为vecvector。返回的迭代器是一个闭包,所以我们可以调用next它。该方法接受:start默认为零的参数:

(defmethod make-iterator ((vec vector) &key (start 0))
  "Vector iterator"
  (let ((index start))
    (lambda ()
      (when (array-in-bounds-p vec index)
        (values (aref vec (shiftf index (1+ index))) t)))))

你现在可以写:

(for (v "abcdefg" :start 2)
  (print v))

这将打印以下字符:

#\c 
#\d 
#\e 
#\f 
#\g

列表迭代器

同样,我们可以构建一个列表迭代器。这里为了演示其他类型的迭代器,让我们有一个自定义光标类型。

(defstruct list-cursor head)

光标是一个对象,它保留对正在访问的列表中的当前 cons-cell 的引用,或 NIL。

(defmethod make-iterator ((list list) &key)
  "List iterator"
  (make-list-cursor :head list))

我们定义next如下,专注于list-cursor

(defmethod next ((cursor list-cursor))
  (when (list-cursor-head cursor)
    (values (pop (list-cursor-head cursor)) t)))

范围

Common Lisp 还允许使用 EQL 专门器来专门化方法,这意味着我们赋予的对象for可能是特定的关键字,例如:range.

(defmethod make-iterator ((_ (eql :range)) &key (from 0) (to :infinity) (by 1))
  (check-type from number)
  (check-type to (or number (eql :infinity)))
  (check-type by number)
  (let ((counter from))
    (case to
      (:infinity
       (lambda () (values (incf counter by) t)))
      (t
       (lambda ()
         (when (< counter to)
           (values (incf counter by) T)))))))

一个可能的呼吁make-iterator是:

(make-iterator :range :from 0 :to 10 :by 2)

这也返回一个闭包。例如,在这里,您将迭代一个范围,如下所示:

(for (v :range :from 0 :to 10 :by 2)
  (print v))

上面展开为:

(let ((#:g1463 (make-iterator :range :from 0 :to 10 :by 2)))
  (loop
   (multiple-value-bind (v #:g1464)
       (next #:g1463)
     (unless #:g1464 (return))
     (print v))))

最后,如果我们添加小修改inf(添加辅助值):

(defun inf (n)
  (lambda ()
    (values (shiftf n (1+ n)) T)))

我们可以写:

(for (v (inf 5))
  (print v)
  (when (= v 7)
    (return)))

哪个打印:

5 
6 
7
于 2021-01-22T11:12:34.470 回答
2

我将用一个库来展示它:

如何使用GTWIWTG生成器库创建和使用无限的整数列表

这个库名为“Generators The Way I Want Them Generated”,它允许做三件事:

  • 创建生成器(迭代器)
  • 将它们结合起来
  • 消耗它们(一次)。

它与近乎经典的系列并无不同。

使用(ql:quickload "gtwiwtg"). 我将在它的包中工作:(in-package :gtwiwtg).

为无限的整数列表创建一个生成器,从 0 开始:

GTWIWTG> (range)
#<RANGE-BACKED-GENERATOR! {10042B4D83}>

我们还可以指定它的:from:to:by参数:inclusive

将此生成器与其他生成器结合使用:此处不需要。

迭代它并停止:

GTWIWTG> (for x *
           (print x)
           (when (= x 7)
             (return)))

0 
1 
2 
3 
4 
5 
6 
7 
T

这个解决方案非常实用:)

于 2021-02-04T10:59:40.917 回答