6

在创建单向、惰性求值、潜在无限迭代器方面,我在使用 Ruby 时遇到了一些问题。基本上,我正在尝试像使用 Haskell 列表一样使用 Ruby,在较小程度上使用 Python 生成器。

并不是我不理解它们本身;我只是不知道如何像其他语言一样随意使用它们,而且我也不确定 Ruby 中的哪些方法会在我背后将它们变成数组,不必要地将整个序列卸载到内存中。

是的,我一直在研究 Ruby 参考手册。半个小时其实,用心。或者显然不是。

例如,如果我要实现一个卡片组,它在 Python 中看起来像这样(未经测试):

# Python 3

from itertools import chain, count

face_ranks =
    dict(
        zip(
            ('jack', 'queen', 'king', 'ace'),
            count(11)))

sorted_deck =
    map(
        lambda suit:
            map(
                lambda rank:
                    {
                        'rank' : rank,
                        'suit' : suit
                    },
                chain(
                    range(2, 11),
                    face_ranks.keys())),
        ('clubs', 'diamonds', 'hearts', 'spades'))

那么,我将如何在 Ruby 中做到这一点,完全避免使用数组?请注意,据我所知,上面的代码仅使用元组和生成器:在任何时候都不会像我使用数组那样将整个序列转储到内存中。我可能对上面的代码有误,但你得到了我想要的。

如何链接迭代器(如 Python 的 chain())?如何生成无限范围的迭代器(如 Python 的 count())?如何在不将整个过程转换为数组的情况下将数组添加到迭代器(例如将元组传递给 Python 的 chain())?

我见过解决方案,但它们涉及阵列或纤维等不必要的复杂性。

在 Python 中,我可以像数组一样简单地操作和抛出迭代器。我几乎可以将它们视为 Haskell 列表,这是我最熟悉的,也是我在编码时真正想到的。我对 Ruby 数组不满意,这就是为什么我寻求其他替代方案的帮助。

我已经设法在互联网上收集到有关它的信息,但我找不到任何涵盖 Ruby 中此类数据结构的基本操作的信息?有什么帮助吗?

4

3 回答 3

4

Ruby 似乎没有很多内置方法来执行您想要对枚举器执行的不同操作,但您可以创建自己的方法。这就是我在这里使用 Ruby 1.9 所做的:

迭代器

def get_enums_from_args(args)
  args.collect { |e| e.is_a?(Enumerator) ? e.dup : e.to_enum }
end

def build(y, &block)
  while true
    y << (begin yield; rescue StopIteration; break; end)
  end
end

def zip(*args)
  enums = get_enums_from_args args
  Enumerator.new do |y|
    build y do
      enums.collect { |e| e.next }
    end
  end
end

def chain(*args)
  enums = get_enums_from_args args
  Enumerator.new do |y|
    enums.each do |e|
      build y do
        e.next
      end
    end
  end
end

def multiply(*args)
  enums = get_enums_from_args args
  duped_enums = enums.collect { |e| e.dup }
  Enumerator.new do |y|
    begin
      while true
        y << (begin; enums.collect { |e| e.peek }; rescue StopIteration; break; end )

        index = enums.length - 1
        while true
          begin
            enums[index].next
            enums[index].peek
            break
          rescue StopIteration
            # Some iterator ran out of items.

            # If it was the first iterator, we are done,
            raise if index == 0

            # If it was a different iterator, reset it
            # and then look at the iterator before it.
            enums[index] = duped_enums[index].dup
            index -= 1
          end
        end
      end
    rescue StopIteration
    end
  end
end

我使用 rspec 编写了一个规范来测试这些功能并演示它们的作用:

iter_spec.rb:

require_relative 'iter'

describe "zip" do
  it "zips together enumerators" do
    e1 = "Louis".chars
    e2 = "198".chars
    zip(e1,e2).to_a.should == [ ['L','1'], ['o','9'], ['u','8'] ]
  end

  it "works with arrays too" do
    zip([1,2], [:a, nil]).to_a.should == [ [1,:a], [2,nil] ]
  end
end

describe "chain" do
  it "chains enumerators" do
    e1 = "Jon".chars
    e2 = 0..99999999999
    e = chain(e1, e2)
    e.next.should == "J"
    e.next.should == "o"
    e.next.should == "n"
    e.next.should == 0
    e.next.should == 1
  end
end

describe "multiply" do
  it "multiplies enumerators" do
    e1 = "ABC".chars
    e2 = 1..3
    multiply(e1, e2).to_a.should == [["A", 1], ["A", 2], ["A", 3], ["B", 1], ["B", 2], ["B", 3], ["C", 1], ["C", 2], ["C", 3]]
  end

  it "is lazily evalutated" do
    e1 = 0..999999999
    e2 = 1..3
    e = multiply(e1, e2)
    e.next.should == [0, 1]
    e.next.should == [0, 2]
    e.next.should == [0, 3]
    e.next.should == [1, 1]
    e.next.should == [1, 2]
  end

  it "resulting enumerator can not be cloned effectively" do
    ranks = chain(2..10, [:jack, :queen, :king, :ace])
    suits = [:clubs, :diamonds, :hearts, :spades]
    cards = multiply(suits, ranks)
    c2 = cards.clone
    cards.next.should == [:clubs, 2]
    c2.next.should == [:clubs, 2]
    c2.next.should == [:clubs, 3]
    c2.next.should == [:clubs, 4]
    c2.next.should == [:clubs, 5]
    cards.next.should == [:clubs, 6]
  end

  it "resulting enumerator can not be duplicated after first item is evaluated" do
    ranks = chain(2..10, [:jack, :queen, :king, :ace])
    suits = [:clubs, :diamonds, :hearts, :spades]
    cards = multiply(ranks, suits)
    cards.peek
    lambda { cards.dup }.should raise_error TypeError
  end
end

如上面的规范所示,这些方法使用惰性求值。

zip此外,这里定义的、chain和函数的主要弱点multiply是生成的枚举数不能轻易复制或克隆,因为我们没有编写任何代码来复制这些新枚举数所依赖的枚举参数。您可能需要创建一个子类Enumerator或创建一个包含Enumerable模块的类或类似的东西才能dup很好地工作。

于 2011-08-08T04:18:45.057 回答
2

Ruby 中最接近的等价物是Enumerator。它可以让你做惰性生成器。

于 2011-08-08T02:25:24.103 回答
2

您似乎出于性能焦虑而避免使用 Ruby 数组,这可能是由于您在其他语言中使用数组的经验。你不必避免使用 Ruby 数组——它们是最接近 Ruby 中元组的东西。

foo = 1, 2, 3, 4
foo.class       #=> Array

看起来您正在寻找 Range 来代替生成器:

range = 1..4
range.class     #=> Range
range.count     #=> 4

('a'..'z').each { |letter| letter.do_something }

范围不会转换为数组,但它确实包含 Enumerable,因此您可以使用所有常规枚举数。就循环/迭代而言——Ruby 中的原生循环是通过 Enumerable 实现的。for i in group实际上是枚举器循环的语法糖(如.each)。可枚举的方法通常会返回发送者,因此您可以将它们链接起来:

(1..10).map { |n| n * 2 }.each { |n| print "##{n}" }
# outputs #2#4#6#8#10#12#14#16#18#20
# returns an array:
#=> [2, 4, 6, 8, 10, 12, 14, 16, 18, 20]

我很乐意为您提供有关您的 Python»Ruby 等效项的更具体的答案,但我不熟悉 Python。

更新

您可以将范围压缩到一个嵌套数组中,如下所示:

(1..26).zip('a'..'z') #=> [[1, 'a'], [2, 'b'], ...]

…但是范围是不可变的。您可以使用 将范围转换为数组(1..5).to_a,也可以像上面显示的那样对其进行迭代。如果您有多个定义的数据范围要测试是否包含,您可以使用几个范围和地图:

allowed = 'a'..'z', 1..100
input = # whatever
allowed.each do |range|
  return false unless range.cover? input
end

当然,您始终可以使用具有范围的枚举器来动态“生成”值。

于 2011-08-08T02:15:55.240 回答