问题标签 [data-integration]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
3 回答
5583 浏览

pentaho - Pentaho 数据集成中保存的转换在哪里

这可能是一个基本问题,但我想知道 Pentaho 数据集成中保存的转换在哪里。目前,我正在连接到一个存储库,我的所有工作和转换都保存在那里。我希望能够通过电子邮件将特定转换发送给另一个人。我在服务器上检查是否有任何 .ktr 文件但找不到任何文件。如何将转换保存到本地桌面。

在此先感谢您的帮助。

0 投票
1 回答
3476 浏览

reporting - Pentaho 报表输出远程执行

我有一个在 CentOS 机器 (osapp) 上运行的 pentaho BI 服务器,然后是 MySQL 数据库,在另一台 CentOS 机器 (osdb) 上运行具有存储库、暂存和数据仓库。我从我的 Windows PC 上运行 Spoon。我创建了一个转换来运行 Pentaho 报告,导出为 PDF 并通过电子邮件发送,每 8 小时自动一次。如果我在 Spoon 中运行转换,它会按预期运行,但是使用我在 BI 服务器 (osapp) 上设置的 carte 服务器会在 Pentaho 报告输出步骤中出现错误,并且没有日志。我看不到错误的详细信息。如果我使用 Pan.sh 运行它,是一样的,但我得到这样的输出:

任何想法我怎么能做到这一点?

谢谢

0 投票
1 回答
9735 浏览

etl - 将 Talend ETL 作业公开为 Web 服务

我目前正在评估 Talend ETL(Talend Open Studio for Data Integration)。

我想知道如何/是否可以将 ETL 作业公开为 Web 服务。

我知道我可以将作业导出为 Web 服务并通过特定的 URL 调用它们,但是我的目标是能够使用 IN / OUT 参数公开特定的 WSDL。

一个示例用例是:

1) 在 Talend ETL 中调用 WS 并将 XML 与数据一起传递

2) Talend ETL 从 XML 中提取数据,并将它们作为变量插入到要针对 DB 执行的查询中。

3) Talend ETL 将结果集从 DB 转换为 XML 数据并响应回 WS 客户端。

最后,我还想知道是否可以将相同的场景公开为 REST 服务。

0 投票
2 回答
1574 浏览

pentaho - 厨房被杀

我正在为 ETL 使用 pentaho 数据集成。我在 ubuntu 服务器中将作业作为 shell 脚本运行。它运行了一段时间后被杀死而没有抛出任何错误。请帮我解决问题并告诉我是否遗漏任何问题。

日志:

0 投票
1 回答
2873 浏览

etl - pentaho 数据集成:执行 PDI BI Server 还是使用 carte?

我正在用 pentaho 做一个项目。我将使用整个社区版解决方案。

我将有一些工作和转换,这些工作和转换将由用户为某些人启动(因此在他们的计算机上使用 PDI),并为其他人自动启动。

我想知道我是否可以在服务器端(使用 BI 服务器和 DW)安装 PDI 并使用它安排自动作业/转换?

还有允许远程执行作业的点菜部分,但我看不出与上面的解决方案有什么区别。

谢谢你的帮助

0 投票
1 回答
796 浏览

data-warehouse - 您如何解决“Pre-Etl”源到目标映射问题?

使用电子表格绝对是非权威的:源映射会随着您设计和测试 ETL 作业而改变。随着 ETL 设计过程的发展,曾经充当所有源映射的单一或权威目录的电子表格可能不会更新——或者(很可能)可能会更新不正确或不完整的信息。您如何解决数据映射问题?

0 投票
1 回答
5754 浏览

etl - 如何使用 pentaho 从网络驱动器复制文件

我已经通过提供如下凭据访问了 FTP 路径

访问 FTP 路径

对于我这样访问的常用文件夹。

访问网络路径

当我的 Windows 电脑存储网络登录密码时,这可以正常工作。我需要在步骤本身中提及,我必须使用哪种类型的步骤或任何其他建议???

提前致谢...

0 投票
1 回答
2161 浏览

mysql - Pentaho 数据集成:连接数据库时出错:使用类 org.gjt.mm.mysql.Driver

我收到此错误,但我的 mysql-connector-java-5.1.23-bin.jar 在 Pentaho\data-integration\libext\JDBC 内。似乎未加载连接器,因为它使用的是默认连接器。我尝试了不同版本的 jdbc,我检查了 MD5,并且我在同一个文件夹中没有相同驱动程序的其他版本。我非常渴望完成这项工作,任何建议表示赞赏。

这是我尝试写入数据库时​​的输出:

0 投票
1 回答
241 浏览

sas - SAS 数据集成工作室:如果查找返回多个值则出错

目前,在我们的 DI 工作室工作中,我们有几个查找。当某个记录的其中一个查找返回多个值时,查找将选择其中一个(我认为是第一个)进行选择。我实际上更愿意收到一个错误,因为对我来说这意味着查找尚未明确定义,我可能需要添加额外的“where”表达式。

有没有这样设置的选项?我现在找不到任何东西。

0 投票
2 回答
14319 浏览

date - Talend Data Integration 中的选角日期

在从一个表到另一个表的数据流中,我想投一个日期。

日期以以下格式作为字符串离开源表:“2009-01-05 00:00:00:000 + 01:00”。

我尝试使用 tConvertType 将其转换为日期,但这显然是不允许的。我的第二个选择是使用 tMap 组件中的公式将此字符串转换为日期。

目前我尝试了这些公式:

这些都不起作用。将结果插入目标表(MySQL、InnoDB)时,会收到日期无效的错误消息。目标字段的格式是 MySQL 日期字段。

如何将日期转换为所需的格式?