Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我有一个用例,我必须将 HDFS 文件格式转换为 csv 或 tsv。我知道我们可以在 hdfs 文件格式之上创建 hive 表并将数据存储为所需格式的方法。但为此,我需要数据信息(如创建表的列名)。有没有其他方法使用 hive 或其他将 hdfs 的任何文件格式转换为 csv 或 tsv 的方法?
首先..要将数据转换为 CSV 或 TSV,您将需要结构化数据,请检查一次。 您指定使用 Hive 转换数据的方式是选项之一。 其他选择是使用火花。-- 在这里您必须以结构化格式读取数据,然后在保存时必须转换为 CSV。更多解释请参考以下链接:
如何将数据从 Spark SQL 导出到 CSV
您也可以使用 python 将数据转换为 CSV。