问题标签 [biginsights]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
hadoop - IBM BigSheets 问题
在直接从 HDFS(作为猪脚本输出的文件)以及位于本地硬盘上的原始数据将文件加载到大工作表时,我遇到了一些错误。我观察到,每当我加载文件并发出行数以查看是否所有数据都加载到 bigsheets 中时,我看到加载的行数较少。我检查了文件是否一致且正确的分隔符(/t 或逗号分隔的字段)。我的文件大小约为 2GB,我使用了 *.csv/ *.tsv 格式中的任何一种。
同样在某些情况下,当我厌倦了直接从 Windows os 加载文件时,文件有时会成功加载,行数与数据中的实际行数匹配,然后有时行数较少。
即使有时当第一次使用新文件时,它也会给出正确的结果,但如果我下次做同样的操作,一些行会丢失。
请分享您的经验,您的 bigsheets,解决未加载整个数据等任何此类问题的解决方案。提前致谢
biginsights - 使用 Hive 将数据流式传输到 BigInsights
我有记录被放到 MQ 队列中。有没有一种好方法可以将它们取下并放入蜂巢表中?
db2 - 无法运行命令创建包装器联合
我正在尝试按照此指南将 BigInsights Federation 设置为 Netezza 。
但是当我执行命令 create wrapper 时,出现错误:
[C2-BIGDATA-BIGINS-MGTNODE.VMS2.COM.VN][bigsql] 1> 创建包装器 nz 库 'libdb2rcodbc.so' OPTIONS(MODULE '/opt/ibm/SDAP71/lib/libodbc.so'); 遇到 SQL 异常:
[状态:58004][代码:15]:BIGSQL-GEN-0010 发现内部错误:'无法执行查询'创建包装器 nz 库'libdb2rcodbc.so' OPTIONS(MODULE'/opt/ ibm/SDAP71/lib/libodbc.so')':第 1:8 行:意外令牌:包装器'。
你知道错误来自哪里吗?如何检查联合服务器是否启用?
biginsights - BigSQL 中的嵌套串联
我正在尝试连接 BigSQL 中的三个字段。我可以成功地连接两个字段
但我无法用它连接三个字段(只接受两个参数)。我尝试通过嵌套连接
但这会返回一个Null
值。我正在尝试创建一个视图,但 select 语句的这一部分不起作用。所有三列都是varchar
所以我不确定问题出在哪里,除非我实际上不允许进行嵌套连接。
linux - 安装 Big Insight 时出现无密码 SSH 错误
在我的 Linux 机器 (RedHat 6.6) 中安装 BigInsight 时出现以下错误。请帮助我如何解决这个问题。
[错误] 先决条件检查 - 无法使用给定的凭据访问节点。在添加节点期间提供 root 密码或确保 BI 管理员用户存在于新节点上,并且从管理节点设置无密码 ssh 到正在添加的新节点。请从安装程序 UI 或响应文件中的 SSH 部分重新访问 Secure Shell 页面,以确保满足所有先决条件,然后重新运行该命令。
java - 即使 jar 包含在类路径中,Eclipse 类也未找到异常
从 Eclipse 在 Biginsights 服务器上运行 java mapreduce 程序会给出 com.mysql.jdbc.Driver ClassNotFoundException,即使 jar 包含在类路径中
错误 :
尝试了几乎所有有关 stackoverflow 中类似问题的建议。
任何建议都会有所帮助。
hadoop - 在明确声明不同字符后,Hadoop 仍将逗号视为分隔符
我目前正在将数据导入配置单元表。当我们创建我们使用的表时
因为我们的数据中有逗号。但是,我们现在发现逗号仍被视为字段分隔符,| 我们用来分隔字段。有没有办法解决这个问题?我们是否必须转义数据中的每一个逗号,还是有更简单的方法来设置它?
示例数据
放入表中时显示为
Jr 占据了自己的专栏并将亚历克斯从桌子上撞了下来。
hadoop - 创建 BigInsights (IBM Hadoop) Docker 映像,sysctl 问题
我正在尝试使用 IBM BigInsights QuickStart Edition 创建一个 docker 映像,以便在带有本地软件安装程序的 DOCKER 容器云(例如 IBM Bluemix)上运行,可以在此处找到:
http://www-01.ibm.com/software/data/infosphere/biginsights/quick-start/downloads.html
问题是,在安装过程中,我收到一些使用 sysctl 访问的内核参数设置不正确的错误。
如果我使用 Dockerfile 调整它们,我会收到一条错误消息:
只读文件系统
现在我想知道是否可以创建一个 BigInsights 映像,因为必须在主机上设置内核参数,这当然我无法在容器云中控制。
Dockerfile 看起来像这样:
在附加到容器后,我运行以下命令:
确切的错误是:
那么基本上如何将 SW 泊坞化,需要设置内核参数等更改?
最好的祝福
罗密欧(金茨勒)
hadoop - DOCKER 容器和主机上的运行时内核参数不一致
我的主机在 Ubuntu 14.04.2 LTS 上,我正在使用最新的 centos 基础映像来创建 IBM InfoSphere BigInsights 的 DOCKER 映像,以便将其推送到 Bluemix Container Cloud。
我已经解决了几乎所有问题,但我坚持使用 sysctl 设置运行时内核参数,因为它们的值错误并且安装程序会抱怨。
当然不可能将它们设置在 DOCKER 容器中,我收到以下错误:
所以我在主机系统上设置了参数:
我什至重建了整个图像并重新创建了容器,但仍然在我得到的 DOCKER 容器内:
有任何想法吗?
biginsights - 在 BigSQL 异常中插入 INTO
我正在table1
Big SQL 中创建一个表(例如),并将数据从 HDFS 加载到table1
. 现在table1
,我需要table2
根据某些条件将数据加载到另一个表中,并且每天将更多数据添加到此表table2
中。每日新数据将被加载table1
,相应的新数据也应进入table2
。
我尝试了以下方法
第一的
遇到 SQL 异常:[状态:42601][代码:-104]:解析错误:
insert append into table table2 as select uri,localtimestamp,count(*) from table1 group by uri order by uri LIMIT 100;
第二
遇到 SQL 异常: [状态:58004][代码:15]:BIGSQL-GEN-0010 发现内部错误:
“无法执行查询insert into table table2 as select uri,localtimestamp,count(*) from table1 group by uri order by uri LIMIT 100;': expected keyword values
”。
第三
在这种情况下,每天都会创建新表,而我希望保留旧数据并添加新数据。
第四
创建表table2
遇到 SQL 异常:
[状态:42601][代码:-104]:解析错误:
<query>insert overwrite table table2 select uri,localtimestamp,count(*) from table1 group by uri order by uri LIMIT 100;</query> Expecting token <into> after token <insert>
第五
遇到 SQL 异常:
[状态:58004][代码:15]:BIGSQL-GEN-0010 发现内部错误:'未能执行查询'
Load from sql query 'select uri, request_timestamp,1 from table1 where $conditions' split column uri into table table2
':解析错误:关键字 hbase 或 hive 预期'。
如果我使用关键字 hive
遇到 SQL 异常:
[状态:58004][代码:15]:BIGSQL-GEN-0010 发现内部错误:'无法执行查询'
Load hive from sql query 'select uri, request_timestamp,1 from table1 where $conditions' split column uri into table table2
'`:原始表达式结束于(行:1,列:143):由于 Hive MetaStore 中的错误,语句失败。Hadoop 日志条目标识符:“[4d4e59269]”:com.ibm.biginsights.catalog.translator.hive.HiveExceptionTranslator$HiveNestedException:失败:ParseException 行 1:5 不匹配输入“来自”,在加载语句中期待“加载”附近的数据
知道如何使用INSERT INTO
语句或如何使用 IBM BigSQL(版本 1)将数据从表加载到另一个
更新
我也试过了LOAD
,但得到了例外
遇到 SQL 异常:[状态:58004][代码:15]:BIGSQL-GEN-0010 发现内部错误:'无法执行查询
'LOAD FROM SQL QUERY 'select t1.uri, t1. request_timestamp,t1.cell_lac from sample.web3 t1 where $conditions' split column t1.uri into table sample.u2_table'
:解析错误:关键字 hbase 或 hive 预期'。
遇到 SQL 异常:[状态:58004][代码:15]:BIGSQL-GEN-0010 发现内部错误:'无法执行查询
'LOAD FROM SQL QUERY 'select t1.uri, t1.request_timestamp,t1.cell_lac from sample.web3 t1 where $conditions' split column t1.uri into hive table sample.u2_table'
:解析错误:关键字 hbase 或 hive 预期'。
遇到 SQL 异常:[状态:58004][代码:15]:BIGSQL-GEN-0010 发现内部错误:'无法执行查询
'LOAD FROM TABLE sample.web3 COLUMNS (uri,request_timestamp, cell_lac) INTO hive TABLE sample.u2_table APPEND WITH LOAD PROPERTIES (num.map.tasks = 1)'
:解析错误:关键字 hbase 或 hive 预期'。