问题标签 [biginsights]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
136 浏览

hadoop - IBM BigSheets 问题

在直接从 HDFS(作为猪脚本输出的文件)以及位于本地硬盘上的原始数据将文件加载到大工作表时,我遇到了一些错误。我观察到,每当我加载文件并发出行数以查看是否所有数据都加载到 bigsheets 中时,我看到加载的行数较少。我检查了文件是否一致且正确的分隔符(/t 或逗号分隔的字段)。我的文件大小约为 2GB,我使用了 *.csv/ *.tsv 格式中的任何一种。

同样在某些情况下,当我厌倦了直接从 Windows os 加载文件时,文件有时会成功加载,行数与数据中的实际行数匹配,然后有时行数较少。

即使有时当第一次使用新文件时,它也会给出正确的结果,但如果我下次做同样的操作,一些行会丢失。

请分享您的经验,您的 bigsheets,解决未加载整个数据等任何此类问题的解决方案。提前致谢

0 投票
1 回答
83 浏览

biginsights - 使用 Hive 将数据流式传输到 BigInsights

我有记录被放到 MQ 队列中。有没有一种好方法可以将它们取下并放入蜂巢表中?

0 投票
0 回答
314 浏览

db2 - 无法运行命令创建包装器联合

我正在尝试按照此指南将 BigInsights Federation 设置为 Netezza 。

但是当我执行命令 create wrapper 时,出现错误:

[C2-BIGDATA-BIGINS-MGTNODE.VMS2.COM.VN][bigsql] 1> 创建包装器 nz 库 'libdb2rcodbc.so' OPTIONS(MODULE '/opt/ibm/SDAP71/lib/libodbc.so'); 遇到 SQL 异常:
[状态:58004][代码:15]:BIGSQL-GEN-0010 发现内部错误:'无法执行查询'创建包装器 nz 库'libdb2rcodbc.so' OPTIONS(MODULE'/opt/ ibm/SDAP71/lib/libodbc.so')':第 1:8 行:意外令牌:包装器'。

你知道错误来自哪里吗?如何检查联合服务器是否启用?

0 投票
1 回答
284 浏览

biginsights - BigSQL 中的嵌套串联

我正在尝试连接 BigSQL 中的三个字段。我可以成功地连接两个字段

但我无法用它连接三个字段(只接受两个参数)。我尝试通过嵌套连接

但这会返回一个Null值。我正在尝试创建一个视图,但 select 语句的这一部分不起作用。所有三列都是varchar所以我不确定问题出在哪里,除非我实际上不允许进行嵌套连接。

0 投票
1 回答
157 浏览

linux - 安装 Big Insight 时出现无密码 SSH 错误

在我的 Linux 机器 (RedHat 6.6) 中安装 BigInsight 时出现以下错误。请帮助我如何解决这个问题。

[错误] 先决条件检查 - 无法使用给定的凭据访问节点。在添加节点期间提供 root 密码或确保 BI 管理员用户存在于新节点上,并且从管理节点设置无密码 ssh 到正在添加的新节点。请从安装程序 UI 或响应文件中的 SSH 部分重新访问 Secure Shell 页面,以确保满足所有先决条件,然后重新运行该命令。

0 投票
1 回答
812 浏览

java - 即使 jar 包含在类路径中,Eclipse 类也未找到异常

从 Eclipse 在 Biginsights 服务器上运行 java mapreduce 程序会给出 com.mysql.jdbc.Driver ClassNotFoundException,即使 jar 包含在类路径中

错误 :

尝试了几乎所有有关 stackoverflow 中类似问题的建议。

任何建议都会有所帮助。

0 投票
1 回答
289 浏览

hadoop - 在明确声明不同字符后,Hadoop 仍将逗号视为分隔符

我目前正在将数据导入配置单元表。当我们创建我们使用的表时

因为我们的数据中有逗号。但是,我们现在发现逗号仍被视为字段分隔符,| 我们用来分隔字段。有没有办法解决这个问题?我们是否必须转义数据中的每一个逗号,还是有更简单的方法来设置它?

示例数据

放入表中时显示为

Jr 占据了自己的专栏并将亚历克斯从桌子上撞了下来。

0 投票
1 回答
385 浏览

hadoop - 创建 BigInsights (IBM Hadoop) Docker 映像,sysctl 问题

我正在尝试使用 IBM BigInsights QuickStart Edition 创建一个 docker 映像,以便在带有本地软件安装程序的 DOCKER 容器云(例如 IBM Bluemix)上运行,可以在此处找到:

http://www-01.ibm.com/software/data/infosphere/biginsights/quick-start/downloads.html

问题是,在安装过程中,我收到一些使用 sysctl 访问的内核参数设置不正确的错误。

如果我使用 Dockerfile 调整它们,我会收到一条错误消息:

只读文件系统

现在我想知道是否可以创建一个 BigInsights 映像,因为必须在主机上设置内核参数,这当然我无法在容器云中控制。

Dockerfile 看起来像这样:

在附加到容器后,我运行以下命令:

确切的错误是:

那么基本上如何将 SW 泊坞化,需要设置内核参数等更改?

最好的祝福

罗密欧(金茨勒)

0 投票
1 回答
1140 浏览

hadoop - DOCKER 容器和主机上的运行时内核参数不一致

我的主机在 Ubuntu 14.04.2 LTS 上,我正在使用最新的 centos 基础映像来创建 IBM InfoSphere BigInsights 的 DOCKER 映像,以便将其推送到 Bluemix Container Cloud。

我已经解决了几乎所有问题,但我坚持使用 sysctl 设置运行时内核参数,因为它们的值错误并且安装程序会抱怨。

当然不可能将它们设置在 DOCKER 容器中,我收到以下错误:

所以我在主机系统上设置了参数:

我什至重建了整个图像并重新创建了容器,但仍然在我得到的 DOCKER 容器内:

有任何想法吗?

0 投票
1 回答
1106 浏览

biginsights - 在 BigSQL 异常中插入 INTO

我正在table1Big SQL 中创建一个表(例如),并将数据从 HDFS 加载到table1. 现在table1,我需要table2根据某些条件将数据加载到另一个表中,并且每天将更多数据添加到此表table2中。每日新数据将被加载table1,相应的新数据也应进入table2

我尝试了以下方法

第一的

遇到 SQL 异常:[状态:42601][代码:-104]:解析错误:
insert append into table table2 as select uri,localtimestamp,count(*) from table1 group by uri order by uri LIMIT 100;

第二

遇到 SQL 异常: [状态:58004][代码:15]:BIGSQL-GEN-0010 发现内部错误:
“无法执行查询insert into table table2 as select uri,localtimestamp,count(*) from table1 group by uri order by uri LIMIT 100;': expected keyword values”。

第三

在这种情况下,每天都会创建新表,而我希望保留旧数据并添加新数据。

第四

创建表table2

遇到 SQL 异常:
[状态:42601][代码:-104]:解析错误:

<query>insert overwrite table table2 select uri,localtimestamp,count(*) from table1 group by uri order by uri LIMIT 100;</query> Expecting token <into> after token <insert>

第五

遇到 SQL 异常:
[状态:58004][代码:15]:BIGSQL-GEN-0010 发现内部错误:

'未能执行查询' Load from sql query 'select uri, request_timestamp,1 from table1 where $conditions' split column uri into table table2':解析错误:关键字 hbase 或 hive 预期'。

如果我使用关键字 hive

遇到 SQL 异常:
[状态:58004][代码:15]:BIGSQL-GEN-0010 发现内部错误:

'无法执行查询' Load hive from sql query 'select uri, request_timestamp,1 from table1 where $conditions' split column uri into table table2'`:原始表达式结束于(行:1,列:143):由于 Hive MetaStore 中的错误,语句失败。Hadoop 日志条目标识符:“[4d4e59269]”:com.ibm.biginsights.catalog.translator.hive.HiveExceptionTranslator$HiveNestedException:失败:ParseException 行 1:5 不匹配输入“来自”,在加载语句中期待“加载”附近的数据

知道如何使用INSERT INTO语句或如何使用 IBM BigSQL(版本 1)将数据从表加载到另一个

更新


我也试过了LOAD,但得到了例外

遇到 SQL 异常:[状态:58004][代码:15]:BIGSQL-GEN-0010 发现内部错误:'无法执行查询'LOAD FROM SQL QUERY 'select t1.uri, t1. request_timestamp,t1.cell_lac from sample.web3 t1 where $conditions' split column t1.uri into table sample.u2_table':解析错误:关键字 hbase 或 hive 预期'。

遇到 SQL 异常:[状态:58004][代码:15]:BIGSQL-GEN-0010 发现内部错误:'无法执行查询'LOAD FROM SQL QUERY 'select t1.uri, t1.request_timestamp,t1.cell_lac from sample.web3 t1 where $conditions' split column t1.uri into hive table sample.u2_table':解析错误:关键字 hbase 或 hive 预期'。

遇到 SQL 异常:[状态:58004][代码:15]:BIGSQL-GEN-0010 发现内部错误:'无法执行查询'LOAD FROM TABLE sample.web3 COLUMNS (uri,request_timestamp, cell_lac) INTO hive TABLE sample.u2_table APPEND WITH LOAD PROPERTIES (num.map.tasks = 1)':解析错误:关键字 hbase 或 hive 预期'。