问题标签 [biginsights]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
379 浏览

r - 更大的数据框错误'不知道如何将'df $ V3'转换为类“POSIXct”'

我正在尝试创建一个更大的计算列。首先加载数据:

然后尝试添加一列:

但是,我收到错误消息:

我看了一下课程:

V3 列中的值如下所示:

我不确定如何进行 - 有什么提示吗?


更新:

我试过转换成一个字符:

但是收到以下错误

0 投票
2 回答
90 浏览

r - 如何从 bigr.frame 中按索引选择?

在标准 r 中,我可以使用以下内容按索引进行选择:

但是,如果我在 bigr.frame 上尝试上述操作,我会得到:

的文档[ {bigr}如下:

描述

筛选数据集的行和项目列

用法

"["(x, i, j, ..., drop = TRUE)

论据

x (bigr.frame 或 bigr.matrix) 被操作的对象。如果 x 是 bigr.frame 或 bigr.csv.matrix,则同时支持过滤和投影。如果 x 是 bigr.binary.matrix,则仅支持投影。

i (bigr.vector) 表示过滤条件的逻辑运算(仅适用于 bigr.frame 和 bigr.matrix 对象)

j(字符或整数)表示要投影的列的向量。这些可以是列 ID(即整数)或列名(即字符)

drop在投影单个列的情况下,参数 drop 确定结果应该是 bigr.vector (drop=TRUE) 还是 bigr.frame (drop=FALSE)。默认值为 drop=TRUE。

价值

派生的 bigr.frame、bigr.matrix 或 bigr.vector

也可以看看

bigr.frame bigr.matrix

例子

air[air$UniqueCarrier %in% c("UA", "HA"), c(1,2,3,5:9)]

air[, c("Origin", "Dest")]

air[air$Dest == "SFO", 17]

class(air[, 17, drop=FALSE])

class(air[, 17, drop=TRUE])

我不清楚我是否可以按索引选择。这可能吗?如何?

0 投票
3 回答
221 浏览

ibm-cloud - BigSheets - java.io.IOException: java.lang.reflect.UndeclaredThrowableException

我无法使用 BigInsights on Cloud 上的 BigSheets 浏览数据。当我选择一个文件并更改阅读器类型时,我收到了异常(见下面的截图)。

我以前可以浏览数据。

在此处输入图像描述

0 投票
2 回答
248 浏览

apache-spark - 如何从 Spark 即服务笔记本连接到在 BigInsights on Cloud 上运行的远程配置单元?

我想使用 jdbc 从 spark notebook 连接到在 BigInsights 上运行的配置单元服务。jdbc url 格式为:

从 url 可以看出,此连接需要信任库。我应该如何使信任库可用于作为服务触发?

更新1:

  • 该证书不是由知名 CA 颁发的。
  • 租户无权访问服务上的 JRE/JDK。

更新 2:

我可以使用以下命令添加证书和信任库:

现在问题的最后一部分是如何在 bluemix spark 上的 python notebook 中添加一个 jar?

0 投票
2 回答
626 浏览

apache-spark - 消息:RSA premaster secret 错误。错误代码=-4499,SQLSTATE=08001

我正在尝试从 Bluemix Spark 上的 iPython 笔记本作为服务连接到 BigInsights on Cloud 集群上的 BigSQL。

我的笔记本是这样的:

我收到的例外是:

尝试使用Hive 2.0 jdbc连接时出现类似错误。

0 投票
1 回答
113 浏览

oracle - 使用外部 Oracle 数据库设置 IBM Open Platform

当我尝试使用 Oracle 数据库作为 RDBMS 安装单节点 IBM Open Platform 集群时,我有点困惑。

首先,我知道 IBM Big Insights 的 Hadoop 部分不是相应 Apache 版本的修改版本(就像 HortonWorks 所做的那样),所以当 Ambari(来自 IBM 存储库)让我使用外部 Oracle 数据库时,我想它应该管用。我可能错了,我在糟糕的 IBM 安装指南中找不到任何 Oracle 参考资料来正确设置它(只是它应该与 Oracle 11g R2 一起使用)

因此,就像我使用等效的 HortonWorks 发行版(但使用 IBM 的二进制文件)一样,我使用所有 oracle 参数(--jdbc-db=oracle --jdbc-driver=path/to/ojdbc6)设置了我的 ambari-server .jar,我在 Centos 6.5 上使用 Oracle 11g XE,应该受 IOP 支持)并且我指定了我必须指定的所有内容,以将 Ambari 与 Oracle 一起使用(服务名称、主机、端口......)我创建了 ambari 用户,加载了相应的 Oracle DDL(与 Ambari 一起打包)并创建了我的 Hive 和 Oozie 用户,如... Hortonworks 安装指南中所述。好吧,Ambari 似乎与 Oracle 配合得很好,我可以设置我的集群,直到最后一步:

  • 如果我将 Hive 和/或 oozie 配置为与 oracle 一起使用(从服务配置选项卡验证 oracle 连接是否正常),“审查”步骤(步骤 8)不会显示任何内容(或者有时 IOP 存储库,它似乎随意)。尝试部署启动任务准备并暗示安装的阻塞状态:除了删除数据库并重新加载整个 DDL 以重试外,我无能为力(否则我将获得大量意外的 NullPointerException)
  • 如果我将 Hive 和 Oozie 配置为使用嵌入式 MySQL(默认选择),让 Ambari 对抗 Oracle,一切正常。

难道我做错了什么??或者配置(IBM 开放平台)Hive 和 Oozie 以使用 Oracle 11 是否有任何限制?(当它与 HortonWorks - 相同的 apache 版本 - 和 Cloudera Distribution 一起使用时)

当然,日志文件不会告诉我任何事情......

更新:

我尝试安装 IOP 4.1,首先使用 MySQL 作为我的 Ambari、Hive 和 Oozie 数据库,一切都很好。接下来,我尝试使用 Oracle 11 XE 作为外部数据库安装 IOP 4.1(我配置了 oracle,创建了 ambari、hive 和 oozie oracle 用户并加载了 IOP 4.1 提供的 Ambari Oracle 模式,并配置了与第一次相同的集群,指定Hive、Oozie(和 Sqoop(Oracle 驱动程序))的 Oracle 特性。在将服务部署到所有节点之前,Ambari 应该恢复将要安装的内容,但它没有:有时它不显示任何内容, 有时它只显示 IOP repos url。接下来,尝试部署,它开始准备任务但永远不会结束。就是这样。没有消息,没有日志,什么都没有,它只是卡住了。因为 IOP 4.1 的所需组件是在 HDP 2 中的相同版本中。3(Ambari 2.1、Hive 1.2.1、oozie 4.2.0、hadoop 2.7.1、pig 0.15.0、sqoop 1.4.6 和 zookeeper 3.4.6),我尝试使用 HDP 2.3、Oracle 11 配置完全相同的集群XE,...一切正常。我注意到 HDP 2.3 强制我使用 SSL,而 IOP 没有。HDP 默认使用 Oracle JDK 1.8,而 IOP 实际上提供使用 OpenJDK 1.8。我不知道这是否重要,我会尽量确定...我会在 Ambari 屏幕阻塞时拍照并复制日志跟踪,即使没有错误消息... 默认情况下为 8,而 IOP 实际上提供使用 OpenJDK 1.8。我不知道这是否重要,我会尽量确定...我会在 Ambari 屏幕阻塞时拍照并复制日志跟踪,即使没有错误消息... 默认情况下为 8,而 IOP 实际上提供使用 OpenJDK 1.8。我不知道这是否重要,我会尽量确定...我会在 Ambari 屏幕阻塞时拍照并复制日志跟踪,即使没有错误消息...

如果有人有想法,请分享!谢谢!

0 投票
1 回答
757 浏览

ibm-cloud - 火花脚本失败:java.net.ConnectException:连接被拒绝 org.apache.hadoop.crypto.key.kms.KMSClientProvider.addDelegationTokens

我正在尝试在 BigInsights on Cloud 上运行一个简单的 spark 脚本:

这导致了以下异常:

我见过类似的问题,但没有一个与 Bluemix 上的 BigInsights (hadoop) 相关。

0 投票
1 回答
67 浏览

r - 错误:BigR [bigr.connect]:找不到所需的库“BigRResultSet”

我正在尝试连接到更大的:

但是,我收到以下错误:

注意 BigRResultSet.jar 存在于 libpath 中:

知道什么可能导致这个问题吗?

0 投票
1 回答
103 浏览

ibm-cloud - 在 BigInsights on Cloud 上,HADOOP_HOME 变量应该指向哪里?

我想在云上的 BigInsights 上使用 kite-dataset 工具,并按照安装说明将它安装在我的主文件夹中的 mastermanager 节点上:

但是,当我尝试运行它时,我得到:

此变量应指向 BigInsights on Cloud 的哪个位置?

0 投票
1 回答
21 浏览

ibm-cloud - 如何以编程方式获取 BIGSQL_HEAD 的主机名?

我需要以编程BIGSQL_HEAD方式从脚本中检索我的 BigInsihgts on Cloud 企业集群的主机名,以便自动连接到该主机。

主机名在BIGSQL_HEADAmbari 中 - 如何使用“标准”unix 工具检索此信息?