我是 hadoop 和大数据技术的新手。我喜欢将 parquet 文件转换为 avro 文件并读取该数据。我在几个论坛中搜索,它建议使用 AvroParquetReader。
AvroParquetReader<GenericRecord> reader = new AvroParquetReader<GenericRecord>(file);
GenericRecord nextRecord = reader.read();
但我不确定如何包含 AvroParquetReader。我根本无法导入它。
我可以使用 spark-shell 读取此文件,并可能将其转换为一些 JSON,然后可以将 JSON 转换为 avro。但我正在寻找一个更简单的解决方案。