Apache Avro 在文件处理中的用途是什么?任何人都可以向我解释一下,如果我需要处理 .LZO 格式的 TB 数据,它有用吗?
我可以在 C++ 和 Java 之间进行选择,什么更适合 Avro?
我的真正目的是读取压缩文件并根据某些标准将它们分类为新的不同文件。
先感谢您.... :)
// Serialize user1, user2 and user3 to disk
DatumWriter<User> userDatumWriter = new SpecificDatumWriter<User> (User.class);
DataFileWriter<User> dataFileWriter = new DataFileWriter<User>(userDatumWriter);
dataFileWriter.create(user1.getSchema(), new File("users.avro"));
dataFileWriter.append(user1);
dataFileWriter.append(user2);
dataFileWriter.append(user3);
dataFileWriter.close();