2

是否可以在 Hadoop 中将图像转换为 Avro 格式?

4

1 回答 1

1

Avro 用于描述独立于平台的数据模式(“数据序列化系统”)。

图像本身可以以多种格式(PNG、JPEG、BMP、GIF 等)编码,所有这些都可以表示为字节序列。您还可以定义一些有关图像的元数据(无论如何可能以字节编码,但根据您的用例,提取它可能很有用。

原始模式可能如下(改编自docs):

{"namespace": "example.avro",
 "type": "record",
 "name": "Image",
 "fields": [
     {"name": "filename", "type": "string"},
     {"name": "type",  "type": "string"},
     {"name": "data", "type": "bytes"},
     {"name": "width", "type": "int"},
     {"name": "height", "type": "int"}
 ]
}
于 2013-01-08T01:12:39.867 回答