问题标签 [vora]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
155 浏览

vora - 如何从 VORA 表中删除行

是否有任何功能可以从表中删除行,甚至从路径列表中删除文件,或者我是否必须删除整个表并使用我需要的行重新创建它?

还有一个 TRUNCATE 函数吗?

0 投票
1 回答
71 浏览

vora - 如何在双 NameNode 集群上安装 VORA

我们有一个双 NameNode 集群,nn1 nn2,它处于故障转移模式。因此,如果 nn1 关闭,则 nn2 接管。这似乎是 VORA 的一个问题,它需要一个 Namenode 来处理,HOST:PORT,当它安装在我们的集群上时,它使用故障转移集群名称来代替。

VORA 有没有办法使用这样的系统。

0 投票
1 回答
180 浏览

hive - SAP Vora 1.2 - 在 Ambari 中安装 Hive 时出错

我在 AWS 上使用了 SAP Vora 1.2 映像。我配置了集群并尝试在 Ambari 中安装 Hive。安装 HCat 服务时安装失败:

你能帮我解决这个问题吗?我已经尝试在不同的服务器(微型、中型和大型)上使用此图像 3 次,但总是有相同的错误。

0 投票
1 回答
66 浏览

vora - 如何设置 Vora Table 分区大小?

我已将“partitionSize”选项设置为多个不同的值,并且无论数量多少,我似乎都得到了相同数量的分区。根据文档,应该对应于 HDFS 块大小。有什么我想念的吗。

HDFS 块大小 64M

创建表 TABLE_TEST (DEFINITION_INFO) 使用 com.sap.spark.vora 选项(表名“TABLE_TEST”,partitionSize “64”,路径“/load_from_here/combined.csv”,eagerLoad “true”)

csv大约是680M

0 投票
1 回答
103 浏览

vora - 从 SAP HANA Vora 到 SAP HANA 的书面问题

我正在尝试将数据从 HANA Vora 写入 HANA。

我使用了 HANA 学院中的代码, https://github.com/saphanaacademy/Vora/blob/master/Vora_Writing2HANA.txt

但是,当我执行以下行时出现错误:

hana_datardd.write.format("com.sap.spark.hana").mode(SaveMode.Overwrite).options(HANA_LOAD_OPTIONS).save()

错误显示“错误:未找到:值 SaveMode”</p>

下面是错误的屏幕截图。

Hana Vora 写入 HANA 错误

请指导我将数据从 HANA Vora 写入 HANA。

提前致谢。

0 投票
1 回答
72 浏览

sap - SAP HANA VORA AMI

当我注册免费的 HANA VORA 时,我没有得到 AMI 网址。我收到了一封来自 SAP 的“访问您的免费 HANA VORA”电子邮件,但其中没有 AMI。我应该与谁联系以获取此信息?请帮忙!谢谢 PJ

0 投票
1 回答
167 浏览

hana - 如何负载平衡 Vora HANA 连接

有没有办法在使用
'USING com.sap.spark.hana'制作的 Vora-Hana 表中对 hana 服务器进行负载平衡?

在 OPTIONS 部分中指定了“主机”,是否可以将此点指向多个 HANA 主机?例如"host" "hana1,hana2,hana3"

例如3+1集群,3主1备。

0 投票
1 回答
253 浏览

vora - 如何提高 Vora 性能

我一直在 Sap Spark 控制器以及 Base Spark 服务器的 Vora 和 Hive 中运行一些测试。Controller 和 Spark Thrift 服务器具有相同的配置。

12列
10M行表
680Mb

Spark Server 和 SAP Controller 都以 --master YARN 和相同数量的执行器、执行器内存和内核启动。控制器和 Thrift 服务器位于 Hadoop 集群中的同一台服务器上,我运行一个测试关闭该控制器/Thriftserver,然后启动另一个进行测试。

下面的所有数字都来自Thrift Server Job Completion TimeSAP Controller Job Completion Time,我不等待结果在 HANA 或 Beeline 或 Spark-Shell 中显示。

结果:

Spark-Shell -> Spark Thriftserver -> Hive
Select Column 返回时间:13s
计数返回时间:1.2s

Spark-Shell -> Spark Thriftserver -> Vora
Select Column 返回时间:5s
计数返回时间:100ms

Hana -> Sap Controller -> Hive
Select Column 返回时间:45s
计数返回时间:4s

Hana -> Sap Controller -> Vora
Select Column 返回时间:24s
计数返回时间:2.1s

Beeline -> Spark Thriftserver -> Hive
Select Column 返回时间:35s
计数返回时间:1.9s

Beeline -> Spark Thriftserver -> Vora
Select Column 返回时间:55s
计数返回时间:1.2s

是否有任何重要的性能调优技巧可以帮助控制器?我可以从 Hive 中以比 Vora 中的 Controller 更快的速度进行选择,这一事实很有趣。

0 投票
1 回答
190 浏览

vora - SAP Hana Vora:无法创建 vora 表

我正在尝试vora使用spark-vora. 但无法创建它低于错误...

你能帮我解决这个问题吗?会很感激。

谢谢,阿卡什

0 投票
0 回答
86 浏览

vora - SAP Hana Vora:无法从 hadoop 获取 vora 表到 Hana

我使用 spark-vora 创建了一个 vora 表,然后在 Hana Studio 中创建了一个虚拟表。当我要在 Hana Studio 中查询该表时,它不会向我返回任何内容。甚至也不会收到错误消息。

你能帮我从 Hana Studio 的虚拟表中获取数据吗?

谢谢,阿卡什