“biginsights”的相关标签问题

0 投票

1 回答

136 浏览

hadoop - IBM BigSheets 问题

在直接从 HDFS（作为猪脚本输出的文件）以及位于本地硬盘上的原始数据将文件加载到大工作表时，我遇到了一些错误。我观察到，每当我加载文件并发出行数以查看是否所有数据都加载到 bigsheets 中时，我看到加载的行数较少。我检查了文件是否一致且正确的分隔符（/t 或逗号分隔的字段）。我的文件大小约为 2GB，我使用了 *.csv/ *.tsv 格式中的任何一种。

同样在某些情况下，当我厌倦了直接从 Windows os 加载文件时，文件有时会成功加载，行数与数据中的实际行数匹配，然后有时行数较少。

即使有时当第一次使用新文件时，它也会给出正确的结果，但如果我下次做同样的操作，一些行会丢失。

请分享您的经验，您的 bigsheets，解决未加载整个数据等任何此类问题的解决方案。提前致谢

2014-12-24T12:52:39.483

0 投票

1 回答

83 浏览

biginsights - 使用 Hive 将数据流式传输到 BigInsights

我有记录被放到 MQ 队列中。有没有一种好方法可以将它们取下并放入蜂巢表中？

biginsights

2015-01-08T03:55:43.380

0 投票

0 回答

314 浏览

db2 - 无法运行命令创建包装器联合

我正在尝试按照此指南将 BigInsights Federation 设置为 Netezza 。

但是当我执行命令 create wrapper 时，出现错误：

[C2-BIGDATA-BIGINS-MGTNODE.VMS2.COM.VN][bigsql] 1> 创建包装器 nz 库 'libdb2rcodbc.so' OPTIONS(MODULE '/opt/ibm/SDAP71/lib/libodbc.so'); 遇到 SQL 异常：
[状态：58004][代码：15]：BIGSQL-GEN-0010 发现内部错误：'无法执行查询'创建包装器 nz 库'libdb2rcodbc.so' OPTIONS(MODULE'/opt/ ibm/SDAP71/lib/libodbc.so')'：第 1:8 行：意外令牌：包装器'。

你知道错误来自哪里吗？如何检查联合服务器是否启用？

db2 wrapper federation biginsights

2015-01-21T07:55:02.970

0 投票

1 回答

284 浏览

biginsights - BigSQL 中的嵌套串联

我正在尝试连接 BigSQL 中的三个字段。我可以成功地连接两个字段

但我无法用它连接三个字段（只接受两个参数）。我尝试通过嵌套连接

但这会返回一个Null值。我正在尝试创建一个视图，但 select 语句的这一部分不起作用。所有三列都是varchar所以我不确定问题出在哪里，除非我实际上不允许进行嵌套连接。

biginsights bigsql

2015-02-26T20:22:40.927

0 投票

1 回答

157 浏览

linux - 安装 Big Insight 时出现无密码 SSH 错误

在我的 Linux 机器 (RedHat 6.6) 中安装 BigInsight 时出现以下错误。请帮助我如何解决这个问题。

[错误] 先决条件检查 - 无法使用给定的凭据访问节点。在添加节点期间提供 root 密码或确保 BI 管理员用户存在于新节点上，并且从管理节点设置无密码 ssh 到正在添加的新节点。请从安装程序 UI 或响应文件中的 SSH 部分重新访问 Secure Shell 页面，以确保满足所有先决条件，然后重新运行该命令。

linux ssh biginsights

2015-03-23T11:53:33.233

0 投票

1 回答

812 浏览

java - 即使 jar 包含在类路径中，Eclipse 类也未找到异常

从 Eclipse 在 Biginsights 服务器上运行 java mapreduce 程序会给出 com.mysql.jdbc.Driver ClassNotFoundException，即使 jar 包含在类路径中

错误：

尝试了几乎所有有关 stackoverflow 中类似问题的建议。

任何建议都会有所帮助。

java eclipse jar mapreduce biginsights

2015-03-26T13:58:03.050

0 投票

1 回答

289 浏览

hadoop - 在明确声明不同字符后，Hadoop 仍将逗号视为分隔符

我目前正在将数据导入配置单元表。当我们创建我们使用的表时

因为我们的数据中有逗号。但是，我们现在发现逗号仍被视为字段分隔符，| 我们用来分隔字段。有没有办法解决这个问题？我们是否必须转义数据中的每一个逗号，还是有更简单的方法来设置它？

示例数据

放入表中时显示为

Jr 占据了自己的专栏并将亚历克斯从桌子上撞了下来。

hadoop hive biginsights

2015-03-26T18:20:10.483

0 投票

1 回答

385 浏览

hadoop - 创建 BigInsights (IBM Hadoop) Docker 映像，sysctl 问题

我正在尝试使用 IBM BigInsights QuickStart Edition 创建一个 docker 映像，以便在带有本地软件安装程序的 DOCKER 容器云（例如 IBM Bluemix）上运行，可以在此处找到：

http://www-01.ibm.com/software/data/infosphere/biginsights/quick-start/downloads.html

问题是，在安装过程中，我收到一些使用 sysctl 访问的内核参数设置不正确的错误。

如果我使用 Dockerfile 调整它们，我会收到一条错误消息：

只读文件系统

现在我想知道是否可以创建一个 BigInsights 映像，因为必须在主机上设置内核参数，这当然我无法在容器云中控制。

Dockerfile 看起来像这样：

在附加到容器后，我运行以下命令：

确切的错误是：

那么基本上如何将 SW 泊坞化，需要设置内核参数等更改？

最好的祝福

罗密欧（金茨勒）

hadoop docker ibm-cloud sysctl biginsights

2015-03-30T20:55:25.680

0 投票

1 回答

1140 浏览

hadoop - DOCKER 容器和主机上的运行时内核参数不一致

我的主机在 Ubuntu 14.04.2 LTS 上，我正在使用最新的 centos 基础映像来创建 IBM InfoSphere BigInsights 的 DOCKER 映像，以便将其推送到 Bluemix Container Cloud。

我已经解决了几乎所有问题，但我坚持使用 sysctl 设置运行时内核参数，因为它们的值错误并且安装程序会抱怨。

当然不可能将它们设置在 DOCKER 容器中，我收到以下错误：

所以我在主机系统上设置了参数：

我什至重建了整个图像并重新创建了容器，但仍然在我得到的 DOCKER 容器内：

有任何想法吗？

hadoop docker ibm-cloud sysctl biginsights

2015-03-31T20:35:05.677

0 投票

1 回答

1106 浏览

biginsights - 在 BigSQL 异常中插入 INTO

我正在table1Big SQL 中创建一个表（例如），并将数据从 HDFS 加载到table1. 现在table1，我需要table2根据某些条件将数据加载到另一个表中，并且每天将更多数据添加到此表table2中。每日新数据将被加载table1，相应的新数据也应进入table2。

我尝试了以下方法

第一的

遇到 SQL 异常：[状态：42601][代码：-104]：解析错误：
insert append into table table2 as select uri,localtimestamp,count(*) from table1 group by uri order by uri LIMIT 100;

第二

遇到 SQL 异常： [状态：58004][代码：15]：BIGSQL-GEN-0010 发现内部错误：
“无法执行查询insert into table table2 as select uri,localtimestamp,count(*) from table1 group by uri order by uri LIMIT 100;': expected keyword values”。

第三

在这种情况下，每天都会创建新表，而我希望保留旧数据并添加新数据。

第四

创建表table2

遇到 SQL 异常：
[状态：42601][代码：-104]：解析错误：

<query>insert overwrite table table2 select uri,localtimestamp,count(*) from table1 group by uri order by uri LIMIT 100;</query> Expecting token <into> after token <insert>

第五

遇到 SQL 异常：
[状态：58004][代码：15]：BIGSQL-GEN-0010 发现内部错误：

'未能执行查询' Load from sql query 'select uri, request_timestamp,1 from table1 where $conditions' split column uri into table table2'：解析错误：关键字 hbase 或 hive 预期'。

如果我使用关键字 hive

遇到 SQL 异常：
[状态：58004][代码：15]：BIGSQL-GEN-0010 发现内部错误：

'无法执行查询' Load hive from sql query 'select uri, request_timestamp,1 from table1 where $conditions' split column uri into table table2'`：原始表达式结束于（行：1，列：143）：由于 Hive MetaStore 中的错误，语句失败。Hadoop 日志条目标识符：“[4d4e59269]”：com.ibm.biginsights.catalog.translator.hive.HiveExceptionTranslator$HiveNestedException：失败：ParseException 行 1:5 不匹配输入“来自”，在加载语句中期待“加载”附近的数据

知道如何使用INSERT INTO语句或如何使用 IBM BigSQL（版本 1）将数据从表加载到另一个

更新

我也试过了LOAD，但得到了例外

遇到 SQL 异常：[状态：58004][代码：15]：BIGSQL-GEN-0010 发现内部错误：'无法执行查询'LOAD FROM SQL QUERY 'select t1.uri, t1. request_timestamp,t1.cell_lac from sample.web3 t1 where $conditions' split column t1.uri into table sample.u2_table'：解析错误：关键字 hbase 或 hive 预期'。

遇到 SQL 异常：[状态：58004][代码：15]：BIGSQL-GEN-0010 发现内部错误：'无法执行查询'LOAD FROM SQL QUERY 'select t1.uri, t1.request_timestamp,t1.cell_lac from sample.web3 t1 where $conditions' split column t1.uri into hive table sample.u2_table'：解析错误：关键字 hbase 或 hive 预期'。

遇到 SQL 异常：[状态：58004][代码：15]：BIGSQL-GEN-0010 发现内部错误：'无法执行查询'LOAD FROM TABLE sample.web3 COLUMNS (uri,request_timestamp, cell_lac) INTO hive TABLE sample.u2_table APPEND WITH LOAD PROPERTIES (num.map.tasks = 1)'：解析错误：关键字 hbase 或 hive 预期'。

biginsights bigsql

2015-04-20T07:55:10.057

问题标签 [biginsights]

Reference