问题标签 [infobright]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

40 问题

0 投票

1 回答

241 浏览

vbscript - 通过 vb 脚本连接 Infobright 数据库

谁能告诉我如何通过 vb 脚本连接 infobright 数据库。我写了一个代码，但它显示一个错误：

我写的代码是：

vbscript infobright

2013-06-04T06:44:37.557

0 投票

1 回答

1671 浏览

mysql - 试图根据活动阈值找出每月用户流失的 SQL 查询

我有一个表（我们在 InfoBright 列式存储上，我使用 MySQL Workbench 作为我的界面），它基本上跟踪用户和带有日期戳的活动计数。这是一张每日汇总表。Schema本质上是

我要查找的是每个月有多少用户在流失，活动用户的基础定义为每月活动计数总计 > 10 的用户

要查找我当前正在使用的给定月份中有多少用户处于活动状态

不是 SQL 专家，我相信这可以改进，并希望对此提供意见。

不过，我更大的目标是逐月计算，其中有多少用户是新用户或上个月重复用户。如果没有难看的嵌套或连接，我不知道该怎么做，我觉得它应该相当简单。

提前致谢。

2013-06-24T19:00:06.113

0 投票

0 回答

146 浏览

mysql - 在 infobright 中对结果集进行分组

我正在用 java 编写一个程序来从 infobright 数据库中获取记录。这是我需要的表结构、查询和输出格式。

表结构：

示例查询：

上述查询的结果集将采用以下格式：

search_engine_id 有两种类型，即 1 和 2。

对于给定的一天，一个product_id 最多可以存在两次，即search_engine_id 1 的一条记录和search_engine_id 2 的另一条记录。我想要的是根据product_id 对结果进行分组。所以它看起来像：

在 sql 端这样做的主要原因是为每个 product_id 准备好数据，以便在 java 端使用更少的内存。我已经尝试过group_contact功能，但 infobright 似乎不支持它。有没有办法可以重写查询/利用其他功能来实现这一点？

mysql sql infobright

2013-09-25T09:36:29.300

0 投票

1 回答

819 浏览

mysql - Infobright 查询

我在 Infobright 中有一个包含大约 4000 万行的事实表。在该表上运行查询（如下所示）需要 10 多分钟。

任何想法为什么以及如何调整这个？

顺便说一句，硬件规格是 AWS m1.large。所以抛开网络延迟不谈，这仍然是一个重要的时间间隔。

mysql data-warehouse infobright column-oriented

2013-10-31T03:29:46.410

0 投票

1 回答

2197 浏览

mysql - 在 infobright 中加载数据 infile csv 文件

我有一张表（在 infobright 中成功创建）。

我用的是windows系统

并使用加载 csv 数据文件

我总是得到 err 2 Hy0000 : wrong data or column definition

样本csv数据如下

我将 csv 文件的终止检查为 '\n'

上面的查询在mysql中可以正常工作

mysql infobright

2013-12-06T12:53:44.797

0 投票

1 回答

966 浏览

mysql - SELECT 查询的表结构中的 Brighthouse 优化

我在 MySQL 中有一个包含数百万条记录的表-> 使用 wiki 页面中的注释导入 Infobright，没问题！

这是表格语法

现在我需要运行一个选择查询 450 次，每次使用不同的 'a' 时都会使用这样的约束：

目标是加快调用所有查询的总时间。但我有问题。当我运行选择查询大约 450 次时，平均每个查询需要 0.52 秒！

然而，当我通过 MySQL 运行它时，每个查询大约需要 1.7 毫秒！

我该如何优化它以击败 MySQL 时间？是否需要我使用 'IN' 子句，而不是 '=' 并在 d,e 之上额外选择 'a'？例如：

mysql sql infobright

2014-01-10T16:08:57.247

0 投票

2 回答

2065 浏览

mysql - PDI（Kettle）循环作业步骤并行化

前言

我已经自动化并编写了单个 .ktr 文件的创建，以处理源 (MySQL) 和目标 (InfoBright) 数据库之间的数据提取和同步。为每个表创建一个 .ktr 文件。

我有一组 2 个作业和 2 个转换组成一个“运行”以查找数据同步 .ktr 文件并将它们排队等待执行。

作业 1（入口点）

运行转换以在目标目录中搜索与从命令行传递的通配符匹配的文件
对于每一行，运行 Job 2 (file looper)
运行完成后，做一些错误检查，邮寄，关闭

作业 2（文件循环器）

运行转换以获取结果并使用文件名填充变量
运行 ${filename} 转换以在 MySQL 和 Infobright 之间执行同步
执行一些错误检查、填充错误日志等。标准的正常失败和错误日志记录

这一切都完美无缺。我可以在我的目标目录中排队 250 多个 .ktr 文件，厨房会在大约 9-15 分钟内完成它们，具体取决于要同步的数据量

问题

Pentaho 似乎不支持这种抽象循环执行转换的并行化。Jobs 不像 Transformations 那样支持输出分配。我检查了 Pentaho 支持论坛，并在那里发帖，没有任何回应。

我正在寻找 4 或 5 个并行线程，每个线程执行一个排队的结果（收集的文件名）。我希望这里的某人可以提供一些关于我如何实现这一点的见解，除了手动使用文件名标签查找文件，运行厨房作业 5 次，将文件名标签作为参数传递。

（这并没有真正解决输出结果分配问题，因为它只运行 5 个单独的顺序作业，并且不分配工作负载）

编辑：这是 Pentaho 论坛上带有图片的帖子，这可能有助于说明我在说什么：http ://forums.pentaho.com/showthread.php?162115-Parallelizing-looped-job-step

干杯

mysql pentaho kettle infobright

2014-05-02T04:08:33.493

0 投票

0 回答

649 浏览

mysql - Infobright 启动错误：致命错误：

这是安装日志

这是 bh.err 文件内容

mysql linux infobright

2014-06-13T06:33:40.763

0 投票

1 回答

1292 浏览

mysql - InfoBright - load data from one table to another

Is there a way to insert data into InfoBright tables using LOAD DATA style like from file

mysql sql database infobright

2014-06-25T21:12:31.570

0 投票

1 回答

490 浏览

mysql - InfoBright 软件包是否与 Mysql 一起提供？

我按照https://www.infobright.org/index.php/ICE_Wiki/wiki-4/installation/install-guide-for-linux/的说明进行操作。使用 dpkg 安装 InfoBright 后，我运行：

肯定没有mysqld在运行，所以无法连接到mysql。

然后我使用 apt-get 安装了 mysql-server，并使用 dpkg 重新安装了 InfoBright Community Edition。这次我可以连接到 mysql 服务器，但是我看不到 infobright 引擎。

如下所示的引擎列表

谁能告诉我如何将 InfoBright 与 mysql 集成？

mysql infobright

2014-07-08T09:39:33.520

1 2 3 4 5 6 7 8 9 10

问题标签 [infobright]

前言

问题

Reference