0

通常,我使用带有一些 ETL 工具的 JDBC 连接将数据从一个数据库(即 Teradata)移动到另一个数据库(即 Greenplum)。

但是,这两个数据库都带有内置实用程序,可以非常快速地加载/导出大量数据,比 JDBC 快得多!但据我所知,缺点是它只能对文件执行此操作。

所以,如果我想使用它们,我必须遵循这样的过程 -

Teradata ---(快速导出)---> 文件 ---(Gploader)---> Greenplum

我想知道是否可以跳过文件部分并结合这两个实用程序。

Teradata ---(FastExport & Gploader)--> Greenplum。

这样我就可以非常快速地传输大量数据!

4

1 回答 1

0

是的,你当然可以。Greenplum 支持各种外部表。一种解决方案是使用执行命令的外部表。该命令可以是连接到 Teradata 以获取数据并使用 FastExport 选项的 Java 程序。

我编写了“gplink”工具来做到这一点。它自动为 JDBC 源创建 Greenplum 外部表。

Github: https ://github.com/pivotalguru/gplink

Teradata 连接示例: https ://github.com/pivotalguru/gplink/blob/master/connections/teradata.properties

还有我的博客: http ://www.pivotalguru.com/?page_id=982

于 2019-02-11T14:16:30.877 回答