-1

我有一个用例,我必须将 HDFS 文件格式转换为 csv 或 tsv。我知道我们可以在 hdfs 文件格式之上创建 hive 表并将数据存储为所需格式的方法。但为此,我需要数据信息(如创建表的列名)。有没有其他方法使用 hive 或其他将 hdfs 的任何文件格式转换为 csv 或 tsv 的方法?

4

1 回答 1

0

首先..要将数据转换为 CSV 或 TSV,您将需要结构化数据,请检查一次。
您指定使用 Hive 转换数据的方式是选项之一。
其他选择是使用火花。-- 在这里您必须以结构化格式读取数据,然后在保存时必须转换为 CSV。更多解释请参考以下链接:

如何将数据从 Spark SQL 导出到 CSV

您也可以使用 python 将数据转换为 CSV。

于 2019-01-04T09:14:56.883 回答