问题标签 [kettle]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
3 回答
2093 浏览

excel - 第一列中的空值是否会阻止在 Pentaho Spoon 中导入 Excel 文件?

我正在尝试使用 Pentaho Kettle/Spoon 中的“Excel 输入”转换导入 Excel 文件。Spoon 为第 67 行吐出一个“NullPointerException”,该行在第一列中有一个空值。(前 66 行在第一列中具有非空值。)

以下是错误日志:

有没有办法解决这个问题?

0 投票
1 回答
1856 浏览

kettle - 多个字符串作为表输入中的参数

我正在尝试使用 SQL 之类的 select column from table where column in (?) as ?应该是字符串的串联。我做了脚本,将行连接成“字符串”、“第二字符串”等。我知道,我应该只使用更多的参数,但是到执行的那一刻,我不知道会有多少个参数,每次都是数百个。我想在一个 SQL 中执行此操作,因此将每个参数放在一行中,并检查“为每一行执行”也不完美。

任何线索,如何做到这一点?

0 投票
2 回答
538 浏览

mysql - DatabaseLookup 挂在特定值上

我使用 Kettle 进行一些转换并遇到了一个问题:对于一个特定的行,我的 DatabaseLookup 步骤挂起。它只是没有给出结果。试图停止转换会导致查找步骤的“停止”永无止境。

给定的值一点也不复杂,它与所有其他行/值也没有什么不同。它只是不会继续。

直接在数据库中或在不同的数据库工具(例如 SQuirreL)中执行相同的查询,它可以工作。

我使用 Kettle/Spoon 4.1,数据库是 MySQL 5.5.10。它发生在 Connector/J 5.1.14 和与勺子捆绑在一起的那个。

该步骤完美地初始化(它甚至适用于其他行),我不知道它为什么会失败。Spoon 日志中没有错误消息,控制台/shell 上也没有任何错误消息。

0 投票
1 回答
1434 浏览

sql-server-2005 - 用于连接到 MsSQL 的命名实例的 JNDI 示例

我们正在使用 Pentaho 数据集成(开源 ETL 工具)并尝试使用 JNDI 连接来连接到 MS SQL 2005 数据库。如果我们在服务器上使用默认实例,它工作正常,但是我们遇到的问题是试图让它连接到命名实例。

如果您能提供一个示例或某个地方可以查看,我们将不胜感激。

谢谢。

0 投票
1 回答
1001 浏览

java - 具有动态关键字段的 Kettle 组合查找步骤(维度字段/流中的字段)

五角水壶

我需要使用环境变量在转换的组合查找步骤中动态设置“维度字段”和“流中的字段”字段,它应该类似于

有任何想法吗?

0 投票
1 回答
697 浏览

grouping - 如何在 Kettle/Spoon 中对步骤进行分组?

我的 Kettle/Spoon (4.1.0) 转换变得非常大,到目前为止它有 30 个步骤。它使用 7 个数据源,将产生大约 5 个输出。我想将图表的一部分包含在单个步骤中。可能吗?

0 投票
2 回答
1597 浏览

excel - 根据两列将此 csv/xls 拆分为单独的文件?

我有一个包含以下列的 35 MB Excel 文件:

我想根据“名称”列将文件拆分为几个 csv 文件(最好还根据此列中的值命名文件)。
我还希望文件按“年份”排序(但这当然可以事先在 Excel 中完成。)

非常感谢 bash 脚本或 Kettle/Pentaho 解决方案。(也欢迎替代品。)

0 投票
1 回答
7380 浏览

java - 水壶:processRow() 中的多个 putRows() 正确吗?

我正在处理/etc/group来自系统的文件。CSV input我用分隔符 step加载它:。它有四个字段:group, pwfield, gid, members。该members字段是一个逗号分隔的列表,其中未指定计数的帐户名称从 0 到无限。

我想生成一个包含三个字段的记录列表:group, gid, account。第一步我用User Defined Java Class,第二步我用Select values

示例输入:

示例输出 (XLS) - 预期:

示例输出 (XLS) - 实际错误:

用户定义的 Java 类:

我相信我错过了调用某些管理功能,或者我应该使用createOutRow(). 谷歌没有帮助。

水壶改造图

神奇的是,如果我创建一个如图所示的转换,那么

  • XLS debug Aaccount每行都有正确的值
  • XLS debug B具有重复account值,如示例输出。

如果我Dummy在之前放置一个步骤Select values 7,则XLS debug B变得正确并XLS debug A变得糟糕。

0 投票
1 回答
1622 浏览

kettle - 如何用水壶处理非规范化数据?

Kettle 具有“行规范化器”和“行非规范化器”步骤,例如

http://wiki.pentaho.com/display/EAI/Row+Normalizer

但它们要求您手动配置非规范化表中的字段。我不明白如何实际使用它,因为非规范化表中的字段数取决于规范化表中的行数,这是动态的。例如,在他们的示例中,非规范化输入表中的三个产品有三列,用户必须手动告诉转换如何处理每一个。但在实际应用中,产品的数量会动态变化。因此,此转换仅适用于一个表,在某一时刻。任何具有不同列数的东西都会失败。

我有几十个或几百个看起来非常像他们的示例的非规范化输入文件,它们都有不同的列数。

0 投票
1 回答
2061 浏览

web - 如何使用勺子 /Kettle 从网站中提取数据或文件

如果有人有一些指示,我们需要使用 peantho 水壶从某个网站提取数据,请告诉我。这些文件采用 zip 格式,可在 Web 上的链接中找到。