我正在阅读 Kite SDK 的文档。我无法理解 Kite 数据集和 Hive 表之间的区别
例如,如果要在 Hive 中创建产品数据集,则可以使用此 URI。
dataset:hive:products
这是否意味着,使用 hive cli 我们可以访问同一个表products
Kite SDK 创建的数据集和通过 hive cli 查看的表没有区别。之所以如此,是因为当您使用 Kite SDK 在 Hive 中创建数据集时,您创建的是 Hive 中的表。混乱在于术语。Kite 文档所指的数据集在 Hive 中称为表。
从名为“数据集、视图和存储库 URI”的 Kite SDK 页面 ( http://kitesdk.org/docs/1.1.0/URIs.html ) 中,将数据导入 Hive 表的 URI 格式如下。
dataset:hive:<namespace>/<dataset>
<namespace>
相当于数据库名称。请注意,如果留空,Kite 将采用默认数据库。
<dataset>
相当于表名。
等效命令:
从操作系统终端:
#./kite-dataset show tv_shows/sitcoms
从蜂巢>终端:
hive> select * from tv_show.sitcoms;