似乎没有任何方法可以将数据附加到现有的 Avro 序列化文件。我想让多个进程写入单个 avro 文件,但看起来每次打开它时,我都从头开始。我不想读入所有数据然后再写回。
使用 ruby 示例代码,我尝试了“ab”和“ab+”作为各种设置,但没有任何乐趣。
file = File.open('data.avr', 'wb')
schema = Avro::Schema.parse(SCHEMA)
writer = Avro::IO::DatumWriter.new(schema)
dw = Avro::DataFile::Writer.new(file, writer, schema)
dw << {"username" => "john", "age" => 25, "verified" => true}
dw << {"username" => "ryan", "age" => 23, "verified" => false}
dw.close