我正在使用 Pentaho 数据集成 Spoon。
简短描述:我想获取从流中读取的每一行的值出现在流中的次数。
详细描述:我正在做事实表的转换,当我读取一个csv文件的数据时,我有一个客户在特定时间乘坐了某架飞机。我想添加一个可用座位列,当它出现时读取客户乘坐混凝土飞机旅行的数据,在前面的流程中查看该飞机的可用座位数并减去 1。
例子。
最初,航班 1 有 160 个座位,而航班 2 有 320 个座位。
CSV
Flight | Client
1 | 1
2 | 2
1 | 3
2 | 4
我可以添加一个值是可用座位总数的列。
Flight | Customer | Available seats
1 | 1 | 160
2 | 2 | 320
1 | 3 | 160
2 | 4 | 320
但之后我不知道如何在每次流量读数中获得特定航班的可用座位的最小值。
我想要在我的流程中的最终输出..
Flight | Customer | Available seats
1 | 1 | 159
2 | 2 | 319
1 | 3 | 158
2 | 4 | 318
非常感谢您花时间阅读我的问题。