我知道使用 parquet 创建表的语法,但我想知道使用 parquet 格式创建表并由 snappy 压缩意味着什么,我们如何做到这一点?请帮我一个示例语法。
使用 snappy 压缩有什么好处?
CREATE TABLE emp(id int, name string, department string, salary float)
ROW FORMAT DELIMITED FIELDS TERMINATED BY ','
STORED AS PARQUET TBLPROPERTIES ("parquet.compression"="SNAPPY");
Snappy 在压缩和 CPU 之间进行了很好的权衡。在 parquet 文件中启用 snappy 应该只是您的实用程序类的配置。
创建表信息(名称字符串,城市字符串,距离 int)行格式分隔字段,<terminator>
由<terminator>
存储为 PARQUET tblproperties('parquet.compress'='SNAPPY')的行终止;