我正在尝试编写一个可以打包/解包结构化二进制数据包的自定义 EM::Protocol 模块。数据包结构应该定义为名称/格式对,可以是字符串、其他一些易于解析的格式,或者是某种 DSL。
一些快速的代码来理解这个想法:
module PacketProtocol
def self.included(base)
base.extend ClassMethods
end
def receive_data(data)
# retrieve packet header
# find matching packet definition
# packet.unpack(data)
end
module ClassMethods
def packet(defn)
# create an instance of Packet (see blow) and shove it
# somewhere i can get to later.
end
end
end
module MyHandler
include PacketProtocol
packet '<id:S><len:S><msg:A%{len}>'
end
EM.run do
EM.start_server '0.0.0.0', 8080, MyHandler
end
我的目标是最小化运行时复杂性。每次执行的数据包定义都是静态的,所以我想避免这种(粗略的)实现:
class Packet
FmtSize = {
'S' => 2,
'A' => Proc.new {|fmt| fmt[1..-1].to_i }
}
def initialize(defn)
@fields = defn.scan(/<([^>]+):([^>]+)>/)
end
def pack(data)
data.values.pack @fields.map { |name, fmt| fmt % data }.join
end
def unpack(defn)
data = {}
posn = 0
@fields.each do |name, len|
fmt = len % data
len = FmtSizes[fmt[0]]
len = len.call(fmt) if len.class == Proc
data[name.to_sym] = bytes[posn..posn + len - 1].unpack(fmt)[0]
posn += len
end
data
end
end
data = { :id => 1, :len => 5, :msg = 'Hello' }
packet = Packet.new '<id:S><len:S><msg:A%{len}>'
packed = packet.pack(data)
require 'benchmark'
Benchmark.bm(7) do |x|
x.report('slow') {
100000.times do
unpacked = packet.unpack(packed)
end
}
x.report('fast') {
100000.times do
data = {}
data[:id] = packed[0..1].unpack('S' % data)
data[:len] = packed[2..3].unpack('S' % data)
data[:msg] = packed[4..8].unpack('A%{len}' % data)
end
}
end
# output:
# user system total real
# slow 1.970000 0.000000 1.970000 ( 1.965525)
# fast 0.140000 0.000000 0.140000 ( 0.146227)
在这两个示例中,使用 Packet 类似乎要慢几个数量级。
所以。问题是:
有没有一种方法(或 gem)可以让您在运行时生成代码(而不是简单地评估字符串)?
编辑:
刚刚找到BinData。虽然它的功能集很好,但它的基准测试也慢得多。