0

当我尝试从 talend etl 服务器运行 gpload 进程时,我需要先配置 tgreenpluGPload 组件。在对组件进行配置时,它正在寻找远程 Greenplum 服务器文件,而不是基于本地 Windows 的 talend ETL 文件。

ENV 详细信息

Talend server 基于-windows server 2012

Greenplum Cluster 基于 - centos 7

主要原因: Greenplum 数据库服务器(Linux)对 ETL talend 服务器(窗口)是远程的。因此,当我从窗口服务器运行作业时,greenplum db 服务器对它来说是远程的。另外,我无法配置组件 tgreenplumGPload。

屏幕截图 tgreenplumGPload 设置:

基本设定

高级设置

更多细节: 1) gpfdist 程序在 Greenplum 主控主机上运行。

[gpadmin@mdw ~]$ ps -A | grep gpfdist
20071 pts/0    00:00:00 gpfdist
[gpadmin@mdw ~]$

2) 从 gpdb 命令行检查合并操作 - 以下进程正在 greenplum 服务器中运行。

[gpadmin@mdw ~]$ gpload -f gpload.yml
2017-02-25 20:20:48|INFO|gpload session started 2017-02-25 20:20:48
2017-02-25 20:20:48|INFO|started gpfdist -p 8081 -P 8082 -f "/home/gpadmin/demo/gp_RevenueReport_stg0.txt" -t 30
2017-02-25 20:20:48|INFO|running time: 0.20 seconds
2017-02-25 20:20:48|INFO|rows Inserted          = 0
2017-02-25 20:20:48|INFO|rows Updated           = 3
2017-02-25 20:20:48|INFO|data formatting errors = 0
2017-02-25 20:20:48|INFO|gpload succeeded

Q1: 如何在 Linux 上设置一个共享文件夹供 Windows 访问。这样,我们可以在 tgreenplumGPload 设置中使用。或者有没有其他方法可以做到这一点。

任何帮助将非常感激 !

4

1 回答 1

1

gpfdist 将在 ETL 服务器上运行,而不是在 Master 主机上。

您必须将 ETL 服务器 ip 和名称添加到 Greenplum 集群中所有节点上的 /etc/hosts 文件中。然后,您需要确保 ETL 服务器可以直接与 Greenplum 专用网络中的分段主机通信。这将需要将 Greenplum 使用的 10GB 专用交换机连接到您的 10GB LAN 并创建一个 VLAN,以便您可以访问节点,或者您可以从 ETL 服务器运行 10GB 电缆以打开 10GB 交换机的端口并为其分配一个 IP 地址与现有主机不冲突。

于 2017-02-26T14:58:43.707 回答