问题标签 [apache-kudu]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

133 问题

0 投票

1 回答

76 浏览

database-design - 如何在 Apache Kudu 中建模一对多关系？

我正在尝试在 Apache Kudu 中建模一对多关系。

综上所述，Apache Kudu 没有：

外键
数组数据类型
JSON 支持

因此，通常的建模方法不可用。

我如何建模这种关系？

2019-03-06T10:00:17.253

0 投票

0 回答

109 浏览

apache-drill - Apache Drill Kudu 查询不支持范围 + 哈希多级分区

Drill Kudu 查询不支持 range + hash 多级分区。

Kudu 表：

然后将 20002 行插入 test1，但查询不支持。查询 sql : select count(1) kudu.table_name, result : **No result found.**

apache-drill apache-kudu

2019-03-06T10:58:56.863

0 投票

0 回答

560 浏览

hive - 为 presto 配置 Hive Metastore 并从 s3 和 apache kudu 查询数据

我对 Presto 和 hive 很陌生。在我们的一个应用程序中，我们想使用 presto 从 apache kudu 和 aws s3 查询数据。据我所知，presto 有自己的目录（元）服务，但我们想配置 hive 元存储（没有 hadoop 和 hive），以便将来其他应用程序（例如 spark）可以使用 hive 元存储从 Kudu 和 s3 查询数据。我一直在使用最新版本的 presto 和 kudu。

有人可以帮我配置这个系统吗？

谢谢并恭祝安康

hive presto apache-kudu hive-metastore

2019-03-07T02:25:46.027

0 投票

3 回答

253 浏览

scala - 将 Slick 与 Kudu/Impala 一起使用

Kudu 表可以通过 Impala 访问，因此它的 jdbc 驱动程序。多亏了它可以通过标准的 java/scala jdbc api 访问。我想知道是否可以使用 slick 。或者，如果不是任何其他支持 impla/kudu 的高级 scala db 框架。

scala jdbc slick impala apache-kudu

2019-04-22T19:21:45.693

0 投票

1 回答

341 浏览

api - 使用 KUDU Client API 创建表时，如何设置主键的列顺序？

我正在尝试编写代码，使用 JAVA KuduClient API 将一些表从 SQL Server 传输到 KUDU。在 SQL 上，我得到一个具有复合主键的表（例如：PRIMARY KEY ([ID], [DATA_SOURCE])）。如何保证 KUDU 上的主键列的顺序相同？

api create-table composite-primary-key apache-kudu

2019-05-07T20:24:39.213

0 投票

1 回答

690 浏览

scala - Spark dataframe cast column for Kudu compatibility

(I am new to Spark, Impala and Kudu.) I am trying to copy a table from an Oracle DB to an Impala table having the same structure, in Spark, through Kudu. I am getting an error when the code tries to map an Oracle NUMBER to a Kudu data type. How can I change the data type of a Spark DataFrame to make it compatible with Kudu?

This is intended to be a 1-to-1 copy of data from Oracle to Impala. I have extracted the Oracle schema of the source table and created a target Impala table with the same structure (same column names and a reasonable mapping of data types). I was hoping that Spark+Kudu would map everything automatically and just copy the data. Instead, Kudu complains that it cannot map DecimalType(38,0).

I would like to specify that "column #1, with name SOME_COL, which is a NUMBER in Oracle, should be mapped to a LongType, which is supported in Kudu".

How can I do that?

scala apache-spark impala apache-kudu

2019-05-15T19:27:06.840

0 投票

2 回答

5395 浏览

impala - 在 Impala 中将非 Kudu 转换为 Kudu 表

update statement当我使用下面的代码时，黑斑羚有问题

它返回错误消息：

我想知道我是否可以将我的非 Kudu 表更改为 Kudu 表，或者update statement在 Impala 中是否有非 Kudu 的替代品。TIA

impala apache-kudu

2019-05-17T09:00:01.810

0 投票

1 回答

1061 浏览

jdbc - 为什么从 BigDecimal 转换为 DECIMAL 时 impala-jdbc 会抛出异常？

我正在使用 impala-jdbc 2.6.4.1005 写入 Kudu 表。

将值为 7896163500 的 BigDecimal 插入 DECIMAL(20,2) 时出现此错误。

但是，我插入的值也适合 DECIMAL(12,2)。我不明白为什么我会从驱动程序那里收到此错误。

如果我将列定义为 DECIMAL(30,2) 它可以正常工作。

此外，如果我尝试手动进行演员表，我会得到预期的结果：

jdbc cloudera impala apache-kudu

2019-05-31T08:03:10.763

0 投票

1 回答

1033 浏览

sql - 为什么插入重复主键时 Kudu 不会失败？

来自 Impala 文档：

在大多数关系数据库中，如果您尝试插入已经插入的行，则插入将失败，因为主键会重复。然而，Impala不会使查询失败。相反，它将生成警告，但继续执行插入语句的其余部分。

为什么 Impala/Kudu 会那样做？请注意，插入不会更新值（有一个 upsert 命令），它只会默默地失败。

有没有办法知道我正在插入重复的主键？

sql impala apache-kudu

2019-05-31T14:41:48.690

0 投票

2 回答

378 浏览

apache-spark - “避免每个集群有多个 Kudu 客户端”是什么意思？

我正在查看 kudu 的文档。

下面是对 kudu-spark 的部分描述。

https://kudu.apache.org/docs/developing.html#_avoid_multiple_kudu_clients_per_cluster

避免每个集群有多个 Kudu 客户端。

一种常见的 Kudu-Spark 编码错误是实例化额外的KuduClient对象。在 kudu-spark 中， aKuduClient由KuduContext. Spark 应用程序代码不应创建另一个KuduClient连接到同一个集群。相反，应用程序代码应该使用KuduContext来访问KuduClientusing KuduContext#syncClient。

要诊断KuduClientSpark 作业中的多个实例，请在日志中查找 master 被许多GetTableLocations或GetTabletLocations来自不同客户端的请求（通常大约在同一时间）超载的迹象。这种症状在 Spark Streaming 代码中尤为常见，其中创建KuduClient每个任务将导致来自新客户端的周期性主请求波。

这是否意味着我一次只能运行一个 kudu-spark 任务？

如果我有一个始终将数据写入 kudu 的 spark-streaming 程序，我如何使用其他 spark 程序连接到 kudu？

apache-spark apache-kudu

2019-06-29T07:07:52.790

1 2 3 4 5 6 7 8 9 10

问题标签 [apache-kudu]

避免每个集群有多个 Kudu 客户端。

Reference