我们有小型 hadoop 和 Greenplum 集群。
当前的数据管道流程是:
External table >> hadoop-hawq external readbale table >>hawq internal table.
输出: 1.我们正在尝试使用 GREENPLUM 扩展数据管道。基本上想将HAWQ内部表或外部可读表数据直接推入greenplum。原因是因为我们想编辑我们的文件。另外,HAWQ 不支持更新和删除。是否有任何替代方法来处理或推送数据。请指导。
2.gphdfs协议如何通过GPDB外表访问HDFS数据
提前致谢!