我们想使用pan.sh来执行多个水壶转换。在探索了脚本后,我发现它在内部调用了在 PDI 中运行的spoon.sh脚本。现在的问题是,每次新的转换开始时,它都会为其执行创建一个单独的 JVM(通过 .bat 文件调用),但是我想将它们分组以使用单个 JVM 来克服多个 JVM 对批处理施加的内存限制服务器。
有人可以指导我如何实现这一目标或与我分享文档/资源。
感谢您的出色工作。
我们想使用pan.sh来执行多个水壶转换。在探索了脚本后,我发现它在内部调用了在 PDI 中运行的spoon.sh脚本。现在的问题是,每次新的转换开始时,它都会为其执行创建一个单独的 JVM(通过 .bat 文件调用),但是我想将它们分组以使用单个 JVM 来克服多个 JVM 对批处理施加的内存限制服务器。
有人可以指导我如何实现这一目标或与我分享文档/资源。
感谢您的出色工作。
使用点菜。这正是它的用途。您可以启动服务器(如果您愿意,可以在本地机器上),然后将您的作业提交给它。一个 JVM,一个堆,共享资源。
这样做的好处是可扩展性,所以当你的盒子变得太忙时,只需添加另一个,也使用 carte 并开始将一些作业发送到另一台服务器。
这里有一个旧的但仍然是最新的博客:
http://diethardsteiner.blogspot.co.uk/2011/01/pentaho-data-integration-remote.html
以及 pentaho 网站上的 doco。
启动服务器很简单:
carte.sh <hostname> <port>
还有一个状态页面,您可以使用它来查询您的点菜服务器,因此如果您有一个服务器集群,您可以选择一个安静的服务器来发送您的工作。