问题标签 [infobright]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
241 浏览

vbscript - 通过 vb 脚本连接 Infobright 数据库

谁能告诉我如何通过 vb 脚本连接 infobright 数据库。我写了一个代码,但它显示一个错误:

我写的代码是:

0 投票
1 回答
1671 浏览

mysql - 试图根据活动阈值找出每月用户流失的 SQL 查询

我有一个表(我们在 InfoBright 列式存储上,我使用 MySQL Workbench 作为我的界面),它基本上跟踪用户和带有日期戳的活动计数。这是一张每日汇总表。Schema本质上是

我要查找的是每个月有多少用户在流失,活动用户的基础定义为每月活动计数总计 > 10 的用户

要查找我当前正在使用的给定月份中有多少用户处于活动状态

不是 SQL 专家,我相信这可以改进,并希望对此提供意见。

不过,我更大的目标是逐月计算,其中有多少用户是新用户或上个月重复用户。如果没有难看的嵌套或连接,我不知道该怎么做,我觉得它应该相当简单。

提前致谢。

0 投票
0 回答
146 浏览

mysql - 在 infobright 中对结果集进行分组

我正在用 java 编写一个程序来从 infobright 数据库中获取记录。这是我需要的表结构、查询和输出格式。

表结构:

示例查询:

上述查询的结果集将采用以下格式:

search_engine_id 有两种类型,即 1 和 2。

对于给定的一天,一个product_id 最多可以存在两次,即search_engine_id 1 的一条记录和search_engine_id 2 的另一条记录。我想要的是根据product_id 对结果进行分组。所以它看起来像:

在 sql 端这样做的主要原因是为每个 product_id 准备好数据,以便在 java 端使用更少的内存。我已经尝试过group_contact功能,但 infobright 似乎不支持它。有没有办法可以重写查询/利用其他功能来实现这一点?

0 投票
1 回答
819 浏览

mysql - Infobright 查询

我在 Infobright 中有一个包含大约 4000 万行的事实表。在该表上运行查询(如下所示)需要 10 多分钟。

任何想法为什么以及如何调整这个?

顺便说一句,硬件规格是 AWS m1.large。所以抛开网络延迟不谈,这仍然是一个重要的时间间隔。

0 投票
1 回答
2197 浏览

mysql - 在 infobright 中加载数据 infile csv 文件

我有一张表(在 infobright 中成功创建)。

我用的是windows系统

并使用加载 csv 数据文件

我总是得到 err 2 Hy0000 : wrong data or column definition

样本csv数据如下

我将 csv 文件的终止检查为 '\n'

上面的查询在mysql中可以正常工作

0 投票
1 回答
966 浏览

mysql - SELECT 查询的表结构中的 Brighthouse 优化

我在 MySQL 中有一个包含数百万条记录的表-> 使用 wiki 页面中的注释导入 Infobright,没问题!

这是表格语法

现在我需要运行一个选择查询 450 次,每次使用不同的 'a' 时都会使用这样的约束:

目标是加快调用所有查询的总时间。但我有问题。当我运行选择查询大约 450 次时,平均每个查询需要 0.52 秒!

然而,当我通过 MySQL 运行它时,每个查询大约需要 1.7 毫秒!

我该如何优化它以击败 MySQL 时间?是否需要我使用 'IN' 子句,而不是 '=' 并在 d,e 之上额外选择 'a'?例如:

0 投票
2 回答
2065 浏览

mysql - PDI(Kettle)循环作业步骤并行化

前言

我已经自动化并编写了单个 .ktr 文件的创建,以处理源 (MySQL) 和目标 (InfoBright) 数据库之间的数据提取和同步。为每个表创建一个 .ktr 文件。

我有一组 2 个作业和 2 个转换组成一个“运行”以查找数据同步 .ktr 文件并将它们排队等待执行。

作业 1(入口点)

  • 运行转换以在目标目录中搜索与从命令行传递的通配符匹配的文件
  • 对于每一行,运行 Job 2 (file looper)
  • 运行完成后,做一些错误检查,邮寄,关闭

作业 2(文件循环器)

  • 运行转换以获取结果并使用文件名填充变量
  • 运行 ${filename} 转换以在 MySQL 和 Infobright 之间执行同步
  • 执行一些错误检查、填充错误日志等。标准的正常失败和错误日志记录

这一切都完美无缺。我可以在我的目标目录中排队 250 多个 .ktr 文件,厨房会在大约 9-15 分钟内完成它们,具体取决于要同步的数据量

问题

Pentaho 似乎不支持这种抽象循环执行转换的并行化。Jobs 不像 Transformations 那样支持输出分配。我检查了 Pentaho 支持论坛,并在那里发帖,没有任何回应。

我正在寻找 4 或 5 个并行线程,每个线程执行一个排队的结果(收集的文件名)。我希望这里的某人可以提供一些关于我如何实现这一点的见解,除了手动使用文件名标签查找文件,运行厨房作业 5 次,将文件名标签作为参数传递。

(这并没有真正解决输出结果分配问题,因为它只运行 5 个单独的顺序作业,并且不分配工作负载)

编辑:这是 Pentaho 论坛上带有图片的帖子,这可能有助于说明我在说什么:http ://forums.pentaho.com/showthread.php?162115-Parallelizing-looped-job-step

干杯

0 投票
0 回答
649 浏览

mysql - Infobright 启动错误:致命错误:

这是安装日志

这是 bh.err 文件内容

0 投票
1 回答
1292 浏览

mysql - InfoBright - load data from one table to another

Is there a way to insert data into InfoBright tables using LOAD DATA style like from file

0 投票
1 回答
490 浏览

mysql - InfoBright 软件包是否与 Mysql 一起提供?

我按照https://www.infobright.org/index.php/ICE_Wiki/wiki-4/installation/install-guide-for-linux/的说明进行操作。使用 dpkg 安装 InfoBright 后,我​​运行:

肯定没有mysqld在运行,所以无法连接到mysql。

然后我使用 apt-get 安装了 mysql-server,并使用 dpkg 重新安装了 InfoBright Community Edition。这次我可以连接到 mysql 服务器,但是我看不到 infobright 引擎。

如下所示的引擎列表

谁能告诉我如何将 InfoBright 与 mysql 集成?