问题标签 [kettle]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
excel - 第一列中的空值是否会阻止在 Pentaho Spoon 中导入 Excel 文件?
我正在尝试使用 Pentaho Kettle/Spoon 中的“Excel 输入”转换导入 Excel 文件。Spoon 为第 67 行吐出一个“NullPointerException”,该行在第一列中有一个空值。(前 66 行在第一列中具有非空值。)
以下是错误日志:
有没有办法解决这个问题?
kettle - 多个字符串作为表输入中的参数
我正在尝试使用 SQL 之类的 select column from table where column in (?) as ?应该是字符串的串联。我做了脚本,将行连接成“字符串”、“第二字符串”等。我知道,我应该只使用更多的参数,但是到执行的那一刻,我不知道会有多少个参数,每次都是数百个。我想在一个 SQL 中执行此操作,因此将每个参数放在一行中,并检查“为每一行执行”也不完美。
任何线索,如何做到这一点?
mysql - DatabaseLookup 挂在特定值上
我使用 Kettle 进行一些转换并遇到了一个问题:对于一个特定的行,我的 DatabaseLookup 步骤挂起。它只是没有给出结果。试图停止转换会导致查找步骤的“停止”永无止境。
给定的值一点也不复杂,它与所有其他行/值也没有什么不同。它只是不会继续。
直接在数据库中或在不同的数据库工具(例如 SQuirreL)中执行相同的查询,它可以工作。
我使用 Kettle/Spoon 4.1,数据库是 MySQL 5.5.10。它发生在 Connector/J 5.1.14 和与勺子捆绑在一起的那个。
该步骤完美地初始化(它甚至适用于其他行),我不知道它为什么会失败。Spoon 日志中没有错误消息,控制台/shell 上也没有任何错误消息。
sql-server-2005 - 用于连接到 MsSQL 的命名实例的 JNDI 示例
我们正在使用 Pentaho 数据集成(开源 ETL 工具)并尝试使用 JNDI 连接来连接到 MS SQL 2005 数据库。如果我们在服务器上使用默认实例,它工作正常,但是我们遇到的问题是试图让它连接到命名实例。
如果您能提供一个示例或某个地方可以查看,我们将不胜感激。
谢谢。
java - 具有动态关键字段的 Kettle 组合查找步骤(维度字段/流中的字段)
五角水壶
我需要使用环境变量在转换的组合查找步骤中动态设置“维度字段”和“流中的字段”字段,它应该类似于
有任何想法吗?
grouping - 如何在 Kettle/Spoon 中对步骤进行分组?
我的 Kettle/Spoon (4.1.0) 转换变得非常大,到目前为止它有 30 个步骤。它使用 7 个数据源,将产生大约 5 个输出。我想将图表的一部分包含在单个步骤中。可能吗?
excel - 根据两列将此 csv/xls 拆分为单独的文件?
我有一个包含以下列的 35 MB Excel 文件:
我想根据“名称”列将文件拆分为几个 csv 文件(最好还根据此列中的值命名文件)。
我还希望文件按“年份”排序(但这当然可以事先在 Excel 中完成。)
非常感谢 bash 脚本或 Kettle/Pentaho 解决方案。(也欢迎替代品。)
java - 水壶:processRow() 中的多个 putRows() 正确吗?
我正在处理/etc/group
来自系统的文件。CSV input
我用分隔符 step加载它:
。它有四个字段:group
, pwfield
, gid
, members
。该members
字段是一个逗号分隔的列表,其中未指定计数的帐户名称从 0 到无限。
我想生成一个包含三个字段的记录列表:group
, gid
, account
。第一步我用User Defined Java Class
,第二步我用Select values
。
示例输入:
示例输出 (XLS) - 预期:
示例输出 (XLS) - 实际错误:
用户定义的 Java 类:
我相信我错过了调用某些管理功能,或者我应该使用createOutRow()
. 谷歌没有帮助。
神奇的是,如果我创建一个如图所示的转换,那么
XLS debug A
account
每行都有正确的值XLS debug B
具有重复account
值,如示例输出。
如果我Dummy
在之前放置一个步骤Select values 7
,则XLS debug B
变得正确并XLS debug A
变得糟糕。
kettle - 如何用水壶处理非规范化数据?
Kettle 具有“行规范化器”和“行非规范化器”步骤,例如
http://wiki.pentaho.com/display/EAI/Row+Normalizer
但它们要求您手动配置非规范化表中的字段。我不明白如何实际使用它,因为非规范化表中的字段数取决于规范化表中的行数,这是动态的。例如,在他们的示例中,非规范化输入表中的三个产品有三列,用户必须手动告诉转换如何处理每一个。但在实际应用中,产品的数量会动态变化。因此,此转换仅适用于一个表,在某一时刻。任何具有不同列数的东西都会失败。
我有几十个或几百个看起来非常像他们的示例的非规范化输入文件,它们都有不同的列数。
web - 如何使用勺子 /Kettle 从网站中提取数据或文件
如果有人有一些指示,我们需要使用 peantho 水壶从某个网站提取数据,请告诉我。这些文件采用 zip 格式,可在 Web 上的链接中找到。