0

我正在尝试插入分桶表。当我运行查询时,一切看起来都很好,我在报告中看到了一些写入的字节。Hive 日志中也没有任何错误。
但是当我查看表格时,我什么都没有:(

CREATE TABLE test(
test_datestring,
test_idstring,
test_titlestring,)
CLUSTERED BY (
text_date)
INTO 100 Bucket
ROW FORMAT DELIMITED
FIELDS TERMINATED BY '|'
由 '\n' 终止的行存储为
ORC
位置
'hdfs://myserver/data/hive/databases/test.db/test'
TBLPROPERTIES (
'skip.header.line.count'='1',
'transactional' = '真的')

INSERT INTO test.test
SELECT 'test_date', 'test_id', 'test_title' from test2.green

结果
结束作业 = job_148140234567_254152 将
数据加载到表 test.test
表 test.teststats:[numFiles=100,numRows=1601822,totalSize=9277056,rawDataSize=0]
MapReduce 已启动作业:
Stage-Stage-1:Map:6 Reduce:100累积 CPU:423.34 秒
HDFS 读取:148450105
HDFS 写入:9282219
成功

蜂巢> 从 test.test 限制 2 中选择 *;
OK
耗时:0.124 秒
蜂巢>

4

1 回答 1

1

这个查询真的有效吗?排队后有多余的逗号

test_title string,)

您的列定义中也没有文本日期。可能你的意思是test_date?

CLUSTERED BY (text_date)
于 2016-12-16T21:20:11.870 回答