2

我正在尝试编写一个可以打包/解包结构化二进制数据包的自定义 EM::Protocol 模块。数据包结构应该定义为名称/格式对,可以是字符串、其他一些易于解析的格式,或者是某种 DSL。

一些快速的代码来理解这个想法:

module PacketProtocol
    def self.included(base)
        base.extend ClassMethods
    end

    def receive_data(data)
        # retrieve packet header
        # find matching packet definition
        # packet.unpack(data)
    end

    module ClassMethods
        def packet(defn)
            # create an instance of Packet (see blow) and shove it
            # somewhere i can get to later.
        end
    end
end

module MyHandler
    include PacketProtocol
    packet '<id:S><len:S><msg:A%{len}>'
end

EM.run do
     EM.start_server '0.0.0.0', 8080, MyHandler
end

我的目标是最小化运行时复杂性。每次执行的数据包定义都是静态的,所以我想避免这种(粗略的)实现:

class Packet
    FmtSize = {
        'S' => 2, 
        'A' => Proc.new {|fmt| fmt[1..-1].to_i }
    }

    def initialize(defn)
        @fields = defn.scan(/<([^>]+):([^>]+)>/)
    end

    def pack(data)
        data.values.pack @fields.map { |name, fmt| fmt % data }.join
    end

    def unpack(defn)
        data = {}
        posn = 0
        @fields.each do |name, len|
            fmt = len % data
            len = FmtSizes[fmt[0]]
            len = len.call(fmt) if len.class == Proc
            data[name.to_sym] = bytes[posn..posn + len - 1].unpack(fmt)[0]
            posn += len
        end
        data
    end
end

data = { :id => 1, :len => 5, :msg = 'Hello' }
packet = Packet.new '<id:S><len:S><msg:A%{len}>'
packed = packet.pack(data)

require 'benchmark'

Benchmark.bm(7) do |x|
    x.report('slow') {
        100000.times do
            unpacked = packet.unpack(packed)
        end
    }
    x.report('fast') {
        100000.times do
            data = {}
            data[:id] = packed[0..1].unpack('S' % data)
            data[:len] = packed[2..3].unpack('S' % data)
            data[:msg] = packed[4..8].unpack('A%{len}' % data)
        end
    }
end

# output:
#              user     system      total        real
# slow     1.970000   0.000000   1.970000 (  1.965525)
# fast     0.140000   0.000000   0.140000 (  0.146227)

在这两个示例中,使用 Packet 类似乎要慢几个数量级。

所以。问题是:

有没有一种方法(或 gem)可以让您在运行时生成代码(而不是简单地评估字符串)?

编辑:

刚刚找到BinData。虽然它的功能集很好,但它的基准测试也慢得多。

4

0 回答 0