问题标签 [pentaho-spoon]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
939 浏览

email - Pentaho DI 发送邮件。读取超时

我正在尝试从我的 Gmail 帐户发送电子邮件。下面是我提供的 SMTP 详细信息。

  • 服务器:smtp.gmail.com
  • 端口:465(也试过587)使用
  • 身份验证:是
  • 身份验证用户:我的完整电子邮件 ID
  • 认证密码:我的密码
  • 使用安全身份验证:是
  • 安全连接类型:SSL

这是我得到的错误。

2016/03/16 17:35:45 - [ftp-poc].Mail - 错误(版本 5.2.0.0,buildguy 从 2014-09-30_19-48-28 构建 1):发送消息时出现问题:javax.mail .MessagingException:无法连接到 SMTP 主机:gmail-smtp-msa.l.google.com,端口:465;嵌套异常是:java.net.SocketTimeoutException:读取超时

我试过这两件事。

  1. ping smtp.gmail.com- 成功
  2. telnet smtp.gmail.com 465- 我得到一个空白的黑屏,光标闪烁。键入时没有提示或任何文本出现。但光标移动。
0 投票
1 回答
1850 浏览

logging - 为每个 Pentaho 数据集成作业 (kettle) 使用单独的日志文件

我想让 Pentaho 中的每个作业都将执行信息记录在一个单独的日志文件中,而不是在/opt/pentaho/server/data-integration-server/logs/pentaho.log. 有谁知道如何做到这一点?

或者,是否有一个很好的图形解析器可以用来解析 Pentaho 数据集成日志文件?

0 投票
1 回答
740 浏览

excel - Pentaho,多输入多输出

我一直在试图弄清楚如何设置 Pentaho 为工作的每个输入编写不同的文件。

我的转换将很快能够从 FTP 获取 .txt 文件,不同数量的文件,我现在的转换方式,无论它从文件夹(FTP 或本地)获取多少文件,它都会生成一个大 XLS输出,输出端的信息都是正确的,它都与我想要精确提取的数据匹配,但是为了组织这些文件,我需要 pentaho 从单个输入创建单个文件。

如果文件(//PentahoIn0001.txt,//PentahoIn0002.txt,//PentahoIn0003.txt)被处理,我想要(//PentahoOut0001.xls,//PentahoOut0002.xls,//PentahoOut0003.xls)被创建,并且它现在的方式只是创建一个包含所有三个输入的数据的单个文件。

到目前为止,我已经尝试了几种没有结果的方法,甚至来自这里和外部的帖子都包含其他几个辅助转换和工作来做到这一点,但它根本没有。

0 投票
1 回答
4449 浏览

email - 如何使用 Pentaho 数据集成提取电子邮件附件?

让我从我想要完成的事情开始:

我每天收到 20 封来自客户的报告电子邮件,我必须提取每个附加的 .xls 文件,并根据谁发送文件进行一些简单的转换。

使用 Pentaho 数据集成,我设置了一些转换,但需要将之前提取的文件放在一个文件夹中。

现在我希望 PDI 读取电子邮件帐户(他们已经输入了电子邮件消息),但我可以看到它只读取电子邮件的数据,我还没有找到从某些电子邮件中提取附件并将​​它们保存到的方法文件夹...

如果有人有不包括pentaho的解决方案,请回答我没有和pentaho结婚,只需要完成任务。

谢谢你的帮助。

0 投票
2 回答
150 浏览

pentaho - 每小时从远程数据库中获取数据

昨天我下载

  • Pentaho BI 服务器
  • 数据集成
  • 报表设计器

比我将报表设计器连接到远程数据库并成功获取表并绘制该数据的图表。我的问题是,我想通过从远程数据库中获取新数据每小时运行该文件(我在报告设计中创建),请您逐步指导我如何操作,因为我是所有这些东西的新手。

0 投票
2 回答
12243 浏览

pentaho - 使用 Pentaho Kettle 将空值替换为 NA

我有一个输入 csv 文件,其中一列字段值为空。我想在我的目标表中将该字段值替换为 NA 。在我的目标表中,该列被指定为非空列。

我尝试使用如果字段值为空,值映射器步骤。但它不工作.. 任何人都可以建议如何进行。

0 投票
1 回答
367 浏览

mysql - 使用 Kettle Spoon 添加 xml 父容器元素

我有一个带有发票标题的 mysql 表。这些数据足以创建我的 xml 输出文件。

输出文件的结构必须是:

我创建了 mysql 输入连接、xml 输出并映射了所有字段。一切正常,但我只有两个问题:

  1. 创建发票父元素
  2. 创建客户父元素

将这些容器元素添加到输出 xml 文件中似乎并不简单。

源 mysql 表以平面方式包含所有数据,所以我有这些列:

同样使用父 xml 元素和行 xml 元素我只能管理<bpxml><invoice>元素,但我无法添加<invoices>容器元素和<customer>容器元素。

有一种简单的方法可以将这些容器元素添加到最终流中吗?

0 投票
2 回答
70 浏览

pentaho-spoon - Pentaho Data integartion 数据库连接

我有一个关于 Pentaho 数据集成(社区)的问题,我正在创建一个转换并创建一个到 MySQL 数据库的数据库连接。连接运行良好,但是当我创建第二个转换并且我正在使用数据库步骤时,我无法选择为第一个转换创建的数据库连接。似乎数据库连接与转换有关,但是如何为会话的所有对象创建数据库连接?例如,我可以从每个转换或作业中选择 AgileBI(安装的连接)

谢谢

0 投票
1 回答
268 浏览

pentaho-spoon - 在 Pentaho 勺子中获取 Max id mongodb

我想使用 PDI 勺子获取 mongodb 中的最大 id。

我的收藏中有以下字段:

  • 标识字符串
  • 流派字符串

在我插入新记录之前,我应该获得最大 ID。

您能帮我了解如何获得最大ID吗?

0 投票
1 回答
535 浏览

pentaho-spoon - Mongodb Pentaho Spoon 中的查找值

如何在 Mongodb 中查找值?我使用流查找,但我认为在查找具有大量数据的集合时会出现性能问题。