问题标签 [pentaho-spoon]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
kettle - 勺子输入步骤插件怎么写?
我正在尝试学习如何编写一个输入步骤插件,它写着“hello world”。我在 Step 课程中有问题。我在写下 processRow 函数时遇到了严重的问题,因为所有教程都假设步骤有一些输入并使用 getRow ...并从输入继承元结构:
这是我的课程(没有 processRow 主体):
你能帮我完成代码吗?或转发给我相应的教程?
此致
load-balancing - Pentaho Carte 负载均衡
是否有任何简单的方法可以将作业远程发送到主 Carte 服务器并将每个作业委托给不同的从服务器?
根据我的阅读,我在 Pentaho 中开箱即用的负载平衡的唯一选择是在我的转换中的步骤上调整集群配置,然后包含此配置的转换步骤将使用定义的从服务器。这样我可以有一种“某种”负载平衡方法,但实际上它是单个作业的并行化。
这不是我要找的。我需要的是一种更简单的方法,它不涉及工作并行化的复杂性,而是简单地将每个工作或转换以循环方式传递给不同的从属设备,从而行使所有硬件而不是在主服务器上运行的所有内容.
提前致谢
java - 此主机类型不支持 Spoon:MINGW64_NT-6.1
我试图在 Windows 7 机器上打开 entaho Spoon,但它没有打开。当我运行 SpoonDebug 时,SpoonDebug.txt 给我带来了这个错误:
此主机类型不支持 Spoon:MINGW64_NT-6.1
我应该怎么办?当我运行 Git Bash 时,MINGW64_NT 是程序标题上的名称。
pentaho-design-studio - 如何在 Pentaho 水壶转换中跳过 XML 文件中的第一个空行?
我正在使用 XML 文件格式。我的文件与此类似;第一行是空白的。如何跳过空行?
pentaho - 为输入行的一组字段生成一个新行(并为每个新行生成一个查询)
我们有一个 .csv 文件,其中包含有关城市各区人口迁移流动的信息。我们正在创建一个将数据从 .csv 文件加载到数据库(2 个表)的转换:
每行有以下信息:
- 字段 1:始发区名称
- 字段 2(字段名称 = 目的地地区名称): 字段值 = 从始发地区改变到本目的地地区的人数
这对每个目的地区域重复。
假设有 20 个区,那么字段的总数是 21
我们需要一个生成以下输出(转换数据结构)的步骤: 具有以下结构的新行:
- 字段 1:始发区名称
- 字段 2:目的地地区的名称
- 场 3:从“场 1”区变为“场 2”区的人数
所以这一步的输出必须包含 20x20 行。然后我们将在以下数据库表中插入 400 行:
我们找不到任何可以生成这种新数据结构的转换步骤。我们将尝试使用 javascript 步骤为每个源区手动实现一个循环,然后为每个新行生成插入到数据库表中的内容。
pentaho - Pentaho 数据集成生成动态行
我有一个案例,我正在通过表格输入步骤读取数据。读入的值是:
我要完成的是检查是否存在代理与子代理具有不同值的实例。因此,如果代理 1 没有子代理 1,那么我需要创建一行来拥有:
我不太确定如何将这一单行生成为自己的行。我尝试了几种使用过滤器行和创建常量的方法,但所有尝试要么覆盖了所有不匹配的现有条目并将它们更改为子代理 1,要么创建了代理_1、子代理_1、商家_1 和总计_1 字段。
pentaho - 如何使用 Pentaho 将 CSV 文件分成组?
我是 Pentaho 的新手,正在尝试读取 CSV 文件(我已经这样做了)并根据标识符创建数据块。
例如
我需要这样拆分和分组:(
每个块在第一列等于'1'时开始)
块 a)
B座)
例如
如何使用 Penatho 实现这一点?谢谢。
我发现了一个类似的问题,但答案并没有真正帮助我的案例 Pentaho Kettle 将 CSV 拆分为多个记录
kettle - 手动转置行
我正在使用 denormaliser 步骤,在 denormaliser 步骤的 Targetfieldname 列中我想包含 8000 行,手动输入 8000 行不方便。有人可以帮我做一些自动化吗?
pdi - 在 PDI / Spoon 中复制/移动文件会产生“不是文件”错误
我正在尝试自动每周生成数据库。作为此过程的第一步,我需要从 network location 获取一组文件M:\
。过程如下:
REMOVE_OLD_FILES
从我的本地文件夹 ( ) 中删除任何可能剩余的旧源文件。GET_FILES
使用正则表达式 ( )获取所需文件的名称。- 将文件从网络位置复制到我的本地文件夹以进行进一步处理 (
COPY/MOVE FILES
)
第 3 步是我遇到麻烦的地方,我经常收到以下错误:
但是,当我手动定位网络位置上的“错误”文件并尝试打开或复制它时,没有问题。如果我然后重新运行 Spoon 作业,则此文件不会发生错误(尽管下一个文件可能会导致错误)。
到目前为止,我已经验证了第 1 步和第 2 步运行正确:更具体地说,从第 2 步返回的文件名中没有错误。
显然,我宁愿不必先手动打开所有文件以确保 Spoon 可以正确复制它们。有谁知道可能导致这种行为的原因?
为了完整起见,以下是COPY/MOVE FILES
步骤中选择的参数。
json - 如何使用 Pentaho 从 json 中的三个表到 mongodb 执行复杂文档
我在一个数据库中有三个表。这些表之间有一个外键。表 1 是表 2 的主表,表 2 是表 3 的主表。
我想像这样在 MongoDB 文档中获取数据值和转换:
我已经尝试在 MongoDB 输出步骤中使用“Mongo 文档路径”,但不能对子文档使用“upsert”,正如我们在MongoDB 输出文档中看到的那样:
我如何使用 Pentaho 数据集成 (PDI) 来做到这一点?