问题标签 [pentaho-data-integration]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
462 浏览

java - Linux 环境 Pentaho 中缺少步骤插件

我使用从 Java 应用程序运行的 mongoDBOutput 创建了一个转换。我编辑了我的kettle.properties 以添加KETTLE_PLUGIN_BASE_FOLDERS,如此处所述Java Pentaho Exception MongoDB。这在我的 Windows 机器上运行良好。但是,在 linux 环境中运行它会导致问题,这是我得到的错误:

但是,我已经编辑了kettle.properties 以将KETTLE_PLUGIN_BASE_FOLDERS 指向linux 环境中的插件目录。提前致谢

0 投票
2 回答
1984 浏览

pentaho - 如何在 Pentaho 中为包含子作业的整个作业启用对文本文件的日志记录

我正在尝试存储其中包含 10 个子作业和转换的 Pentaho 作业的日志。我知道我可以通过进入设置并将它们写入文本文件来单独完成每项工作和转换。但我不希望每个子作业有太多文件。有没有一种方法可以存储捕获所有子作业和转换的单个主要作业的日志?

提前致谢。

0 投票
1 回答
405 浏览

pentaho - 如何通过 Pentaho (Kettle) 为 ETL 连接 QuickBooks (QODBC) 数据?

我正在尝试通过 Pentaho (Kettle) 连接 QuickBooks (QODBC) 应用程序数据以进行 ETL 过程。想知道如何通过 Pentaho 连接 QuickBooks (QODBC) 应用程序数据。

0 投票
1 回答
227 浏览

web-services - Pentaho Zimbra Web 服务(未找到 zimbra.xsd)

我正在尝试在系统上实现数据库集成,该系统在创建用户后通过 ZimbraAdminService 在 Zimbra 服务上创建帐户。

服务器版本为8.6

在 Pentaho Web 服务查找步骤中,当我使用https://example.com/service/wsdl/ZimbraAdminService.wsdl填写 URL 字段并点击“加载”按钮时,我收到以下错误:

我已经检查了https://wiki.zimbra.com/wiki/Wsdl上的文档

有人遇到过这样的问题并有解决方案吗?谢谢。

0 投票
1 回答
401 浏览

pentaho-data-integration - 从文本文件输入字段动态生成 DDL 用于表输出

考虑以下三个文件:

1.csv [contains 3 fields: a, b, c] 2.csv [contains 4 fields: d, e, f, g] 3.csv [contains 2 fields: h, i]

我的任务是将所有三个文件加载到它们各自的表输出中。所以

File "*.csv" ->loads-> Table "*_csv"

我知道我可以使用“获取文件名”步骤处理多个文件,但是如何生成为每个文件创建目标表的 DDL 语句?我正在查看元数据注入步骤,但我不确定这是否符合我的需求。

有什么建议吗?


Pentaho 数据集成 7.0 Postgres RDS

0 投票
2 回答
2798 浏览

pentaho - PDI Pentaho 中的文本文件输出问题

我需要帮助解决这个问题。在转换中,我从表输入中创建了一个由分号分隔的文本文件,但是当我查看该文件时,这显示了空行。

这是我所做的转换:文本文件输出中的选项

在此处输入图像描述

这是结果:文本文件结果

在此处输入图像描述

0 投票
1 回答
410 浏览

sql-server - 如何在 pentaho 中模拟内存表变量中的 SQL 更新

我是pentaho的新手。基本上我对层次结构数据有一个要求,我选择一个层次结构的子集,我需要在较低级别的节点上进行计数/求和,然后逐级进行计数+先前的计数总和等。这就是我所知道的使用表变量执行 sql(这里的要点是我需要在内存中执行此操作,而不是在数据表中执行任何更新。)

在对 sql 中的 temp 变量进行更新后,我只需从 @ConsolidateMaster 中选择 * 。我如何在 pentaho 中实现类似的功能。

0 投票
0 回答
326 浏览

sql-server - Pentaho Kettle 中要加载到 MS SQL Server 的货币数据类型

当最终目标是将数据加载到 MS SQL Server 时,使用 Pentaho Kettle 处理货币字段的最佳方法是什么?MS SQL Server 有一个“金钱”数据类型,但这在 Pentaho 中不可用。我可以将该列转换为字符串,然后在加载为某种浮点十进制数字数据类型之前去掉货币符号,但这似乎是手动的,我猜 Pentaho 具有更复杂的内置功能。

谢谢。

0 投票
1 回答
2302 浏览

pentaho - Pentaho-carte rest api?

我刚开始使用 Pentaho 数据集成,并且能够从 UI 创建转换/作业并从 UI 以及 Pentaho DI java SDK 运行它们。此外,我成功设置了 carte 服务器,提交了转换,并在 carte webUI 上监控了它的状态。

我的问题是

carte 服务器是否还公开了任何 JSON/XML REST API,我可以通过这些 API 提交作业/转换并监控它们的进度?现在它似乎只为通过浏览器使用而开发。

谢谢 - 尼丁,

0 投票
1 回答
761 浏览

pentaho - 在 Pentaho 中对不同数量的文件迭代输入步骤

我有一个get file names获取 4 个 csv 文件的正则表达式的步骤。之后,我有一个text file input步骤可以设置 csv 的字段,并读取这些文件。

完成此步骤后,Table output将执行一个步骤。

问题是text file input似乎在一个语句中读取了所有 4 个文件,因此该table output语句插入了 4 个文件的行。所以我的输出表有 20 行(每个文件 5 行)

预期的行为是读取一个文件,在输出表中插入文件的 5 行并执行 sql 脚本,将该表移动到最终表并截断临时表。现在对第二个、第三个和最后一个文件重复该过程。

加载文件的每一步都会删除临时表,但最终表不会,它是增量的。

我怎么能在pentaho中做到这一点?