apache-spark - Spark 会话未初始化 | sparkR.session() 给出错误“if (len > 0) { 中的错误：参数长度为零”

Question

我目前正在使用托管在 databricks 集群外部的 Rstudio 服务器，并按照步骤配置 Databricks Connect。连接测试也成功了。但是当我使用下面的代码初始化一个火花会话时，它会抛出一个错误。

>>library(SparkR)
>>sparkR.session()

我什至尝试了下面的命令，但抛出了同样的错误：

SparkR::sparkR.session()

WARN NativeCodeLoader: Unable to load native-hadoop library for your platform... using builtin-java classes where applicable Using Spark's default log4j profile: org/apache/spark/log4j-defaults.properties 将默认日志级别设置为“WARN”。要调整日志记录级别，请使用 sc.setLogLevel(newLevel)。对于 SparkR，使用 setLogLevel(newLevel)。if (len > 0) { 中的错误：参数长度为零

我想访问数据块上的 SQL 表或在 R 中编写一个 sql 查询，如下所示：

diamonds <- sql("select * from default.diamonds")

需要初始化火花会话。让我知道是否可以应用任何其他替代方案。

score 0 · Accepted Answer

我有一个类似的问题。我对我的代码进行了以下更改。

library(SparkR, lib.loc = "/usr/local/spark/R/lib")
sparkEnvir <- list(spark.num.executors='5', spark.executor.cores='5')
# initializing Spark context
sc <- sparkR.init(sparkHome = "/usr/local/spark",
                  sparkEnvir = sparkEnvir)
# initializing SQL context
sqlContext <- sparkRSQL.init(sc)

apache-spark - Spark 会话未初始化 | sparkR.session() 给出错误“if (len > 0) { 中的错误：参数长度为零”

1 回答 1

Related

Reference