问题标签 [pentaho-spoon]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
oracle - Configure Pentaho data Integration to connect to Oracle DB
I have configured Oracle VirtualBox with DB, user and populated a small DB. In the same machine I've installed Pentaho Data-Integration(Spoon), the JDBC driver and I'm trying to create a connection to Oracle DB but without success. This is where I'm typing the credentials/data:
Host Name: localhost
Database Name: (DESCRIPTION=(ADDRESS_LIST=(ADDRESS=(PROTOCOL=TCP)(HOST=localhost)(PORT=1521)))(CONNECT_DATA=(SERVICE_NAME=ORCL)))
Port Number: 1521
User Name: SYSTEM
Password: oracle
How can I configure it in order to connect Pentaho/Spoon to the Oracle DB? The oracle DB seems to be working fine, I've also tried with other users/databases that I created, but the result is the same.
cassandra - Pentaho Cassandra 输入:键空间中不存在列族
我正在尝试在 Pentaho Spoon UI 中设置来自 Cassandra 的输入步骤。但是当我尝试显示架构或运行任务时,我得到以下异常:
我可以使用 CQLSH 和 DevCenter 访问键空间中的表。我也尝试过其他键空间和表,只是为了得到同样的错误。
任何想法都将不胜感激,因为我似乎无法在此处或其他论坛中找到此问题的任何先前答案。
postgresql - 数据仓库事实表生成
目前,我正在构建基于我的 ODS 表和维度表的事实表。我的 ODS 表
1.dateWiseData
sid_date
总印象数
2.设备(手机,PC等)
sid_date
设备ID
设备名称
总印象数
3.AdvertiserData
sid_date
广告客户 ID
广告客户名称
总印象数
事实表
ID
sid_date
设备ID
广告客户 ID
总印象数
在这里,我们面临将所有三个表数据连接到单个事实表中的问题。在这种情况下,我们在每张桌子上都有三个不同的总印象数。但实际上表我们只是添加了单个总印象数。我们如何计算它然后加入。我们尝试了不同的连接技术人员,但没有找到完美的解决方案。
请帮助我们处理此案
pentaho - 在单个 JVM 上运行多个 Kettle 转换
我们想使用pan.sh来执行多个水壶转换。在探索了脚本后,我发现它在内部调用了在 PDI 中运行的spoon.sh脚本。现在的问题是,每次新的转换开始时,它都会为其执行创建一个单独的 JVM(通过 .bat 文件调用),但是我想将它们分组以使用单个 JVM 来克服多个 JVM 对批处理施加的内存限制服务器。
有人可以指导我如何实现这一目标或与我分享文档/资源。
感谢您的出色工作。
javascript - Javascript:在数据库字段中查找星号
我正在检查 Pentaho 数据集成中的数据流,并且正在使用一些 Javascript。某些字段可能有一个星号作为值。所以我有:
所有值都设置为“A”,即使值不是“*”的字段也是如此。我努力了:
我知道我必须逃避它,只是不确定我应该如何将它写成正则表达式。
pentaho - Pentaho 中的同步共享定义
Pentaho 有没有办法创建一个同步的共享定义?
假设我们有一个源文件 s1,它用于两个转换 t1、t2。现在,假设我在 t1 中进行更改并在 s1 中再添加一列,我希望它也能反映在 t2 中。Pentaho 有没有办法做到这一点?
当我们在 Pentaho 中共享数据库连接时,所有更改都会反映在我们使用它的任何地方。我们也可以对文件做类似的事情吗(如果我正在创建文件的共享定义并将其存储在存储库中,然后在其他转换中使用它)?
谢谢你的时间。
mysql - 连接数据库时出错:(使用类org.gjt.mm.mysql.Driver)语句(1)没有打开游标
我正在开发 Pentaho 数据集成工具 5.2 版。我正在尝试使用“表格输入”步骤连接到数据库。但是当我在此步骤中测试连接时,它会给我以下错误消息。我可以使用 MySQL 工作台连接到数据库。我已将“ mysql-connector-java-5.1.38-bin
”文件放在文件夹中libext
。
我需要降级我的连接器 jar 文件吗?如果是,我的 SQL 版本是 5.6,那么有人可以告诉我此 SQL Server 版本的兼容连接器 jar 版本吗?
pentaho - 数据库存储库 (Oracle) 与文件系统作为 Pentaho 的存储库
我想在我的工作中使用 Pentaho。经过一番研究,我发现要存储 ktr/kjb 文件,我可以将数据库作为存储库,也可以将文件系统用作存储库。但是,我没有发现将数据库用作文件系统的存储库的任何好处。这里存储库的基本目的是创建一个通用位置,我可以将所有已开发的 ktr/kjb 文件保存在生产环境中。基本上,如果我考虑数据库存储库,它将在生产中保存所有已开发的 ktr/kjb 文件,并且每次我需要运行作业/转换时,我都会连接到数据库以获取相应的 ktr/kjb 文件(类似于 informatica 存储的方式另一方面,基于文件的存储库就像一个包含所有已开发文件的文件夹。
这里有人可以解释这两种存储库的优缺点吗?
如果您需要任何其他信息,请告诉我。
提前致谢。