当我尝试从 talend etl 服务器运行 gpload 进程时,我需要先配置 tgreenpluGPload 组件。在对组件进行配置时,它正在寻找远程 Greenplum 服务器文件,而不是基于本地 Windows 的 talend ETL 文件。
ENV 详细信息
Talend server 基于-windows server 2012
Greenplum Cluster 基于 - centos 7
主要原因: Greenplum 数据库服务器(Linux)对 ETL talend 服务器(窗口)是远程的。因此,当我从窗口服务器运行作业时,greenplum db 服务器对它来说是远程的。另外,我无法配置组件 tgreenplumGPload。
屏幕截图 tgreenplumGPload 设置:
更多细节: 1) gpfdist 程序在 Greenplum 主控主机上运行。
[gpadmin@mdw ~]$ ps -A | grep gpfdist
20071 pts/0 00:00:00 gpfdist
[gpadmin@mdw ~]$
2) 从 gpdb 命令行检查合并操作 - 以下进程正在 greenplum 服务器中运行。
[gpadmin@mdw ~]$ gpload -f gpload.yml
2017-02-25 20:20:48|INFO|gpload session started 2017-02-25 20:20:48
2017-02-25 20:20:48|INFO|started gpfdist -p 8081 -P 8082 -f "/home/gpadmin/demo/gp_RevenueReport_stg0.txt" -t 30
2017-02-25 20:20:48|INFO|running time: 0.20 seconds
2017-02-25 20:20:48|INFO|rows Inserted = 0
2017-02-25 20:20:48|INFO|rows Updated = 3
2017-02-25 20:20:48|INFO|data formatting errors = 0
2017-02-25 20:20:48|INFO|gpload succeeded
Q1: 如何在 Linux 上设置一个共享文件夹供 Windows 访问。这样,我们可以在 tgreenplumGPload 设置中使用。或者有没有其他方法可以做到这一点。
任何帮助将非常感激 !