我有两个带有架构的表
表:运行1
标识字符串 week_date 字符串 公制双
表:run2
标识字符串 公制双 week_date 字符串 统计数据 分区信息 col_name data_type 注释 week_date 字符串 统计数据
我想将每个星期日期的数据分组为相同的大小,然后将内容写入一个新表,该表根据星期日期以及统计数据进行分区(统计数据只不过是存储桶 id)。
我发现查询分区结果正确但是分区内的内容未排序
下面是我正在使用的查询和我正在使用的数据以及来自其中一个分区的输出
询问:
insert overwrite table run2 partition(week_date, statistic) select id,metric, week_date, ntile(3) over (PARTITION BY week_date order by metric) as statistic from run1 distribution by week_date sort by metric desc;
输入:
B0001 2015-01-08 200.0 B0002 2015-01-08 200.0 B0003 2015-01-08 800.0 B0004 2015-01-08 600.0 B0005 2015-01-08 5400.0 B0006 2015-01-08 1100.0 B0007 2015-01-08 100.0 B0008 2015-01-08 300.0
分区输出:week_date=2015-01-08/statistic=2
B0003^A800.0 B0008^A300.0 B0004^A600.0
我期望内容按度量值排序,但事实并非如此。如果我不将结果插入另一个表而只是进行简单的选择,我确实会看到内容确实已排序。执行插入时是否需要做一些特别的事情?