问题标签 [pentaho]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
oracle - 水壶 / 自动参考表
我有一个人的excel表,每个人都有一个父亲和一个母亲在同一个人表中。我的 exel 表如下所示:
人 ---父亲 --- 母亲
约翰--------托尼-----简
托尼--------杰克
我想将数据导入到如下所示的 Oracle 数据库表中:
id --- 人 ---父亲 --- 母亲
0 -----插孔
1 -----托尼-------- 0
2 -----简
我的工作流程应该是什么?
3 ----约翰 -------- 1------------2
pentaho - pentaho spoon - change owner of created dir/files
is there an easy way to create files/directories with a different owner to the account being used to run pentaho? Thanks in advance.
dynamic - Pentaho-kettle:需要根据用户输入动态创建 ETL 作业
在我的应用程序中,用户可以指定其文件的格式。我们根据用户输入动态创建 SSIS 包。
http://lakshmik.blogspot.com/2005/05...eate-ssis.html
动态创建的 SSIS 包用于处理用户的文件。
我们想要评估 Pentaho-Kettle 是否满足此要求。Kettle 是否可以根据用户的输入动态创建 ETL 作业?
如果不是 Pentaho,是否有任何 Java ETL 工具允许使用动态创建 ETL 作业?
automation - 如何根据日期戳自动检索文件
我是 pentaho 套件及其自动化功能的新手。我有每天都会收到的文件,需要放置两列。我已经想出了如何添加列,但现在我被困在自动化方面。文件名是不变的,但最后有一个日期戳。例如:LEAVER_REPORT_NEW_20110623.csv。该文件将始终位于同一目录中。我该如何使用 Pentaho 数据集成来解决这个问题?我试过获取文件,但这似乎不起作用。
mdx - Pentaho CDF - MDX 查询:显示月份之间的数据(参数)
我有两个参数:“从月”和“到月”。我想显示这几个月之间的数据。这是我的情况:
它是一个拨号图表,我想显示与去年相比的销售额百分比以及月份之间的范围。
在 SQL 中这很容易:其中月 >= 从月和月 <= 月。由于您只能在 MDX 查询中切片一次,我不知道该怎么做。我希望有一个人可以帮助我。
提前致谢
csv - 如何在spoon,pentaho中按列合并2个csv文件,同时管理数据转换?
我面临以下问题:
我有两个输入:
1)我有一个包含 35 列及其正确标题的 csv 基本文件。
2) 我有各种不由我控制的给定文件,它们可能包含也可能不包含 35 列,更糟糕的是,它们可能出现故障。
我必须将第二个 csv 文件中的列与第一个 csv 文件中的列匹配。如果第二个 csv 文件没有全部 35 列,我应该按正确的顺序创建它们。
一旦我有一个适当的 csv 文件(一个标题看起来像第一个 csv 标题的文件),我会将它传递给一个脚本,该脚本管理通过列标题引用它们的数据。
一种可能的解决方案是在脚本中获取现有的字段输入,但是,我无法做到这一点,因为这些字段似乎是固定的,引用了第二个 csv 文件的现有列标题。因此,当我尝试访问不存在的列时,我最终会遇到异常......
任何帮助将不胜感激!
excel - 第一列中的空值是否会阻止在 Pentaho Spoon 中导入 Excel 文件?
我正在尝试使用 Pentaho Kettle/Spoon 中的“Excel 输入”转换导入 Excel 文件。Spoon 为第 67 行吐出一个“NullPointerException”,该行在第一列中有一个空值。(前 66 行在第一列中具有非空值。)
以下是错误日志:
有没有办法解决这个问题?
pentaho - Pentaho 与 REST 的数据集成
我正在尝试使用 un/pwd 身份验证通过 SSL 连接到休息 API。我可以浏览 URL - 但是当我运行该作业时,什么也没有发生。本质上,我只想连接到服务器并将数据输出到 xml 文件中。
先感谢您
工作:
日志:
2011/07/28 15:42:10 - 转换元数据 - 我们有 0 个连接... 2011/07/28 15:42:10 - 转换元数据 - 读取 2 个步骤... 2011/07/28 15:42: 10 - 转换元数据 - 查看步骤 #0 2011/07/28 15:42:10 - 转换元数据 - 查看步骤 #1 2011/07/28 15:42:10 - 转换元数据 - 我们有 1 个跃点... 2011/07/28 15:42:10 - 转换元数据 - 看 hop
0 2011/07/28 15:42:10 - 转换元数据 - nr 步骤读取:
2 2011/07/28 15:42:10 - 转换元数据 - 读取的跳数:1 2011/07/28 15:42:10 - 勺子 - 转换打开。2011/07/28 15:42:10 - Spoon - 启动转换 [测试]... 2011/07/28 15:42:10 - Spoon - 开始执行转换。2011/07/28 15:42:10 - 测试 - 为转换开始调度 [测试] 2011/07/28 15:42:10 - 测试 - 检测到的参数数量:0 2011/07/28 15:42:10 -测试 - 这不是重播转换 2011/07/28 15:42:10 - 转换元数据 - 在 {0} 毫秒内执行的自然步骤(计算先前步骤的 {1} 时间)2011/07/28 15:42: 10 - 测试 - 我发现了 2 个不同的启动步骤。2011/07/28 15:42:10 - 测试 - 分配行集... 2011/07/28 15:42:10 - 测试 - 为第 0 步分配行集 --> REST 客户端 2011/07/28 15:42: 10 - 测试 - prevcopies = 1,
2011/07/28 15:42:10 - 测试 - 分配步骤和 StepData... 2011/07/28 15:42:10 - 测试 - 转换即将分配 [Rest] 类型的步骤 [REST Client] 2011/ 07/28 15:42:10 - 测试 - 步骤的 nrcopies=1 2011/07/28 15:42:10 - REST Client.0 - 分发激活 2011/07/28 15:42:10 - REST Client.0 -开始分配缓冲区和新线程... 2011/07/28 15:42:10 - REST Client.0 - 步骤信息:nrinput=0 nroutput=1 2011/07/28 15:42:10 - REST Client.0 - 输出相对。是 1:1 2011/07/28 15:42:10 - REST Client.0 - 找到输出行集 [REST Client.0 - XML Output.0] 2011/07/28 15:42:10 - REST Client.0 -完成调度 2011/07/28 15:42:10 - 测试 - 转换已分配新步骤:[REST Client].0 2011/07/28 15:42:0/1。2011/07/28 15:42:10 - XML Output.0 - 在从服务器上运行
0/1。2011/07/28 15:42:10 - XML Output.0 - 打开输出流
编码:UTF-8 2011/07/28 15:42:10 - 测试 - 步骤 [REST Client.0] 已完美初始化。2011/07/28 15:42:10 - 测试 - 步骤 [XML Output.0] 已完美初始化。2011/07/28 15:42:10 - 测试 - 转换已分配 2 个线程和 1 个行集。2011/07/28 15:42:10 - REST Client.0 - 开始运行... 2011/07/28 15:42:10 - REST Client.0 - 向 1 个输出行集发出“输出完成”信号。2011/07/28 15:42:10 - XML Output.0 - 开始运行... 2011/07/28 15:42:10 - REST Client.0 - 完成处理 (I=0, O=0, R =0, W=0, U=0, E=0) 2011/07/28 15:42:10 - XML Output.0 - 向 0 个输出行集发出“输出完成”信号。2011/07/28 15:42:10 - XML Output.0 - 完成处理 (I=0, O=0, R=0, W=0, U=0, E=0) 2011/07/28 15: 42:10 - 勺子 - 改造完成!!
mysql - DatabaseLookup 挂在特定值上
我使用 Kettle 进行一些转换并遇到了一个问题:对于一个特定的行,我的 DatabaseLookup 步骤挂起。它只是没有给出结果。试图停止转换会导致查找步骤的“停止”永无止境。
给定的值一点也不复杂,它与所有其他行/值也没有什么不同。它只是不会继续。
直接在数据库中或在不同的数据库工具(例如 SQuirreL)中执行相同的查询,它可以工作。
我使用 Kettle/Spoon 4.1,数据库是 MySQL 5.5.10。它发生在 Connector/J 5.1.14 和与勺子捆绑在一起的那个。
该步骤完美地初始化(它甚至适用于其他行),我不知道它为什么会失败。Spoon 日志中没有错误消息,控制台/shell 上也没有任何错误消息。
hadoop - 将 pentaho 社区与 hadoop 集成
我想将 hadoop 集成到 pentaho 数据集成,我在 pentaho 网站上找到,在该网站上有用于 hadoop 的 pentaho,但它是商业的。我想让我的数据集成社区版与 hadoop 集成。我怎么能解决这个问题?
Tks