问题标签 [sparkling-water]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
3 回答
367 浏览

apache-spark - 通过火花包使用苏打水:com.google.guava... 未找到

我正在尝试通过火花包使用 H2O.ai 的苏打水。我正在遵循他们的指南:https ://github.com/h2oai/sparkling-water#use-sparkling-water-via-spark-packages我正在使用带有 Scala 2.10 和 Spark 1.6.1 的 Hortonworks HDP 2.4。我在终端中输入了以下内容:

但是,它抱怨没有找到两个工件。以下是详细信息:

任何人都有任何经验我可以解决它吗?非常感谢。

0 投票
1 回答
310 浏览

apache-spark - 使用苏打水将 Spark MLLib 算法集成到 H2O ai

我正在尝试将 Spark MLLib 中的协作算法与 H2o Ai 使用苏打水进行产品推荐。我跟着这个链接

http://spark.apache.org/docs/latest/mllib-collaborative-filtering.html

并更新代码如下

当我在 Intellij 中运行代码时,出现以下错误

我该如何解决这个错误?

提前致谢。

0 投票
1 回答
533 浏览

apache-spark - 输入线太长 - Spark

sparkling-shell2.cmd执行bat 文件时出现以下错误。我走过,在spark-shell.cmd使用以下参数执行时出现此错误

错误:输入行太长。

我该如何解决这个问题?

谢谢

0 投票
3 回答
1739 浏览

apache-spark - Spark Shell - 文件名、目录名或卷标语法不正确

spark-shell.cmd使用以下参数运行时出现错误

"C:\SoftwareLibraries\spark\spark-2.0.1\bin\spark-shell.cmd" --jars "C:\SoftwareLibraries\H2o\sparklingWater\bin\assembly\build\libs\sparkling-water-assembly_2.11 -2.0.5-all.jar"

文件名、目录名或卷标语法不正确。

任何人都可以帮忙吗?谢谢

0 投票
1 回答
390 浏览

scala - 苏打水在纱线客户端模式下工作但不在集群模式下

我正在尝试以纱线集群模式提交我的苏打水应用程序,但它失败了。但是,它以客户端模式运行。

我正在使用以下内容提交我的 jar:

在集群模式下运行时出现以下错误:

0 投票
1 回答
47 浏览

apache-spark - 错误:值 trainModel 不是 hex.tree.gbm.GBM 的成员

当我尝试用火花添加 H2O 并使用 GBM 模型时。我在打包时遇到了这个异常。这是我第一次用 spark 运行 H2O。我刚刚尝试在我的 spark 应用程序中添加 H2O 库,并在 H2O 中使用了 GBM。

0 投票
2 回答
757 浏览

scala - 未找到 H2o 包装 Scala 苏打水

我正在尝试在我的本地 Spark 2.1.0 实例上运行苏打水。我遵循了有关 Sparling Water的H2o文档。但是当我尝试执行

我收到以下错误:

文件名、目录名或卷标语法不正确。

我查看了批处理文件,执行以下命令时出现此错误:

当我删除--conf spark.driver.extraJavaOptions="-XX:MaxPermSize=384m"时,Spark 启动但我无法导入 H2o 的包。

错误:对象 h2o 不是包 org.apache.spark 的成员

我尽我所能,但无法解决这个问题。有人可以帮我吗?谢谢

0 投票
1 回答
37 浏览

apache-spark-mllib - 我可以只使用一些用于创建 GBM 模型的列并且仍然在监督学习中进行预测吗?

在 GBM 模型中 - 我有近 150 个列用于训练和创建模型 - 我有一个案例,对于某些记录,我不会获得所有列。在那种情况下,模型会起作用吗?在这种情况下,我不想将值设置为 0。?

0 投票
0 回答
61 浏览

apache-spark - RSparkling:从 RSparkling 访问 hive 的 metastore_db 时出现 SqlException

我正在使用 Apache Spark 2.0.1 在本地系统上运行 RSparkling。当我设置

h2o_context(sc)

我获得了使用winutils.exe设置的/tmp/hive的权限异常。之后,当我尝试运行以下命令时

我得到了例外:

0 投票
1 回答
113 浏览

spark-streaming - H2O Spark 流式传输 2.1 分发

在苏打水中运行示例 IRIS 模型时,我一直间歇性地遇到分布错误。

苏打水:2.1 Spark streaming kafka - 0.10.0.0 使用 spark 提交在本地运行 - 只有 master