我正在使用AvroKeyInputFormat
读取 avro 文件:
val records = sc.newAPIHadoopFile[AvroKey[T], NullWritable, AvroKeyInputFormat[T]](path)
.map(_._1.datum())
因为我需要在工作中反思架构,所以我得到了这样的 Avro 架构:
val schema = records.first.getSchema
不幸的是,如果 avro 文件path
为空(它们包括 writer 模式,但没有记录),这将失败。
即使没有记录,是否有一种简单的方法可以仅使用 Spark 加载 avro 模式?