1

我正在阅读 Kite SDK 的文档。我无法理解 Kite 数据集和 Hive 表之间的区别

例如,如果要在 Hive 中创建产品数据集,则可以使用此 URI。

dataset:hive:products

这是否意味着,使用 hive cli 我们可以访问同一个表products

4

1 回答 1

1

Kite SDK 创建的数据集和通过 hive cli 查看的表没有区别。之所以如此,是因为当您使用 Kite SDK 在 Hive 中创建数据集时,您创建的是 Hive 中的表。混乱在于术语。Kite 文档所指的数据集在 Hive 中称为表。

从名为“数据集、视图和存储库 URI”的 Kite SDK 页面 ( http://kitesdk.org/docs/1.1.0/URIs.html ) 中,将数据导入 Hive 表的 URI 格式如下。

dataset:hive:<namespace>/<dataset>

<namespace>相当于数据库名称。请注意,如果留空,Kite 将采用默认数据库。

<dataset>相当于表名。

等效命令:

从操作系统终端:

#./kite-dataset show tv_shows/sitcoms

从蜂巢>终端:

hive> select * from tv_show.sitcoms;
于 2016-02-02T22:46:02.573 回答