问题标签 [infobright]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
vbscript - 通过 vb 脚本连接 Infobright 数据库
谁能告诉我如何通过 vb 脚本连接 infobright 数据库。我写了一个代码,但它显示一个错误:
我写的代码是:
mysql - 试图根据活动阈值找出每月用户流失的 SQL 查询
我有一个表(我们在 InfoBright 列式存储上,我使用 MySQL Workbench 作为我的界面),它基本上跟踪用户和带有日期戳的活动计数。这是一张每日汇总表。Schema本质上是
我要查找的是每个月有多少用户在流失,活动用户的基础定义为每月活动计数总计 > 10 的用户
要查找我当前正在使用的给定月份中有多少用户处于活动状态
不是 SQL 专家,我相信这可以改进,并希望对此提供意见。
不过,我更大的目标是逐月计算,其中有多少用户是新用户或上个月重复用户。如果没有难看的嵌套或连接,我不知道该怎么做,我觉得它应该相当简单。
提前致谢。
mysql - 在 infobright 中对结果集进行分组
我正在用 java 编写一个程序来从 infobright 数据库中获取记录。这是我需要的表结构、查询和输出格式。
表结构:
示例查询:
上述查询的结果集将采用以下格式:
search_engine_id 有两种类型,即 1 和 2。
对于给定的一天,一个product_id 最多可以存在两次,即search_engine_id 1 的一条记录和search_engine_id 2 的另一条记录。我想要的是根据product_id 对结果进行分组。所以它看起来像:
在 sql 端这样做的主要原因是为每个 product_id 准备好数据,以便在 java 端使用更少的内存。我已经尝试过group_contact
功能,但 infobright 似乎不支持它。有没有办法可以重写查询/利用其他功能来实现这一点?
mysql - Infobright 查询
我在 Infobright 中有一个包含大约 4000 万行的事实表。在该表上运行查询(如下所示)需要 10 多分钟。
任何想法为什么以及如何调整这个?
顺便说一句,硬件规格是 AWS m1.large。所以抛开网络延迟不谈,这仍然是一个重要的时间间隔。
mysql - 在 infobright 中加载数据 infile csv 文件
我有一张表(在 infobright 中成功创建)。
我用的是windows系统
并使用加载 csv 数据文件
我总是得到 err 2 Hy0000 : wrong data or column definition
样本csv数据如下
我将 csv 文件的终止检查为 '\n'
上面的查询在mysql中可以正常工作
mysql - SELECT 查询的表结构中的 Brighthouse 优化
我在 MySQL 中有一个包含数百万条记录的表-> 使用 wiki 页面中的注释导入 Infobright,没问题!
这是表格语法
现在我需要运行一个选择查询 450 次,每次使用不同的 'a' 时都会使用这样的约束:
目标是加快调用所有查询的总时间。但我有问题。当我运行选择查询大约 450 次时,平均每个查询需要 0.52 秒!
然而,当我通过 MySQL 运行它时,每个查询大约需要 1.7 毫秒!
我该如何优化它以击败 MySQL 时间?是否需要我使用 'IN' 子句,而不是 '=' 并在 d,e 之上额外选择 'a'?例如:
mysql - PDI(Kettle)循环作业步骤并行化
前言
我已经自动化并编写了单个 .ktr 文件的创建,以处理源 (MySQL) 和目标 (InfoBright) 数据库之间的数据提取和同步。为每个表创建一个 .ktr 文件。
我有一组 2 个作业和 2 个转换组成一个“运行”以查找数据同步 .ktr 文件并将它们排队等待执行。
作业 1(入口点)
- 运行转换以在目标目录中搜索与从命令行传递的通配符匹配的文件
- 对于每一行,运行 Job 2 (file looper)
- 运行完成后,做一些错误检查,邮寄,关闭
作业 2(文件循环器)
- 运行转换以获取结果并使用文件名填充变量
- 运行 ${filename} 转换以在 MySQL 和 Infobright 之间执行同步
- 执行一些错误检查、填充错误日志等。标准的正常失败和错误日志记录
这一切都完美无缺。我可以在我的目标目录中排队 250 多个 .ktr 文件,厨房会在大约 9-15 分钟内完成它们,具体取决于要同步的数据量
问题
Pentaho 似乎不支持这种抽象循环执行转换的并行化。Jobs 不像 Transformations 那样支持输出分配。我检查了 Pentaho 支持论坛,并在那里发帖,没有任何回应。
我正在寻找 4 或 5 个并行线程,每个线程执行一个排队的结果(收集的文件名)。我希望这里的某人可以提供一些关于我如何实现这一点的见解,除了手动使用文件名标签查找文件,运行厨房作业 5 次,将文件名标签作为参数传递。
(这并没有真正解决输出结果分配问题,因为它只运行 5 个单独的顺序作业,并且不分配工作负载)
编辑:这是 Pentaho 论坛上带有图片的帖子,这可能有助于说明我在说什么:http ://forums.pentaho.com/showthread.php?162115-Parallelizing-looped-job-step
干杯
mysql - Infobright 启动错误:致命错误:
这是安装日志
这是 bh.err 文件内容
mysql - InfoBright - load data from one table to another
Is there a way to insert data into InfoBright tables using LOAD DATA style like from file
mysql - InfoBright 软件包是否与 Mysql 一起提供?
我按照https://www.infobright.org/index.php/ICE_Wiki/wiki-4/installation/install-guide-for-linux/的说明进行操作。使用 dpkg 安装 InfoBright 后,我运行:
肯定没有mysqld在运行,所以无法连接到mysql。
然后我使用 apt-get 安装了 mysql-server,并使用 dpkg 重新安装了 InfoBright Community Edition。这次我可以连接到 mysql 服务器,但是我看不到 infobright 引擎。
如下所示的引擎列表
谁能告诉我如何将 InfoBright 与 mysql 集成?