我已将“partitionSize”选项设置为多个不同的值,并且无论数量多少,我似乎都得到了相同数量的分区。根据文档,应该对应于 HDFS 块大小。有什么我想念的吗。
HDFS 块大小 64M
创建表 TABLE_TEST (DEFINITION_INFO) 使用 com.sap.spark.vora 选项(表名“TABLE_TEST”,partitionSize “64”,路径“/load_from_here/combined.csv”,eagerLoad “true”)
csv大约是680M