是否可以在 Hadoop 中将图像转换为 Avro 格式?
问问题
776 次
1 回答
1
Avro 用于描述独立于平台的数据模式(“数据序列化系统”)。
图像本身可以以多种格式(PNG、JPEG、BMP、GIF 等)编码,所有这些都可以表示为字节序列。您还可以定义一些有关图像的元数据(无论如何可能以字节编码,但根据您的用例,提取它可能很有用。
原始模式可能如下(改编自docs):
{"namespace": "example.avro",
"type": "record",
"name": "Image",
"fields": [
{"name": "filename", "type": "string"},
{"name": "type", "type": "string"},
{"name": "data", "type": "bytes"},
{"name": "width", "type": "int"},
{"name": "height", "type": "int"}
]
}
于 2013-01-08T01:12:39.867 回答