问题标签 [hiveddl]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

119 问题

0 投票

1 回答

2144 浏览

sorting - 分区 BY、CLUSTERED BY 和 SORTED BY 与 BUCKETS 之间的 Hive 区别以及使用 PARTITIONED 和 CLUSTER BY 插入覆盖？

我已经看到了一些很好的解释来创建一个分区为CLUSTERED BY和的表SORTED BY。这与创建带有分区的表，然后使用填充表（INSERT OVERWRITE例如）相比CLUSTER BY如何？是CLUSTER BY表内的持久排序吗？

2014-01-30T01:18:52.920

0 投票

1 回答

1114 浏览

amazon-s3 - 子目录上的 S3 hive 外部表不起作用

我有以下 s3 目录结构。

所以我正在创建蜂巢外部表如下

当我在这个表上运行查询时，没有任何数据返回，没有任何异常。如果我只将相同的文件放在一个目录中并且没有分区，那么它运行良好。我也试过 bey 设置

知道我哪里错了吗？

amazon-s3 hive hiveql hive-partitions hiveddl

2015-10-22T10:39:56.063

0 投票

1 回答

4702 浏览

hive - 如何在 hive 中查找数据库中创建的表数？

我需要找出每个模式中创建的表的数量，并找出每个模式占用的大小。

hive hdfs hive-metastore hiveddl

2015-12-26T06:36:27.600

0 投票

2 回答

670 浏览

hadoop - hive add partition 语句忽略前导零

我在 hdfs 上有文件夹
/user/test/year=2016/month=04/dt=25/000000_0

需要将上述分区路径添加到测试表中。

命令：

但是这个添加分区命令忽略了月份分区中的前导零，并在 2016 内创建了一个额外的文件夹，月份 = 4。 /user/test/year=2016/month=04/ /user/test/year=2016/month=4/ 并且 table 将指向/user/test/year=2016/month=4/这个不包含任何数据的路径。

我检查了日志，上面写着 WARN org.apache.hadoop.hive.ql.parse.BaseSemanticAnalyzer - Partition Spec month=04 has been changed to month=4

请让我知道是否有人遇到过这种问题以及如何避免这种情况？

Hive 版本是：1.2.1000

hadoop hive hadoop-yarn hive-partitions hiveddl

2016-06-24T15:47:21.427

0 投票

2 回答

20001 浏览