GCP Dataproc sqoop 可以从本地数据库导入数据以放入 GCP 存储(没有 GCP VPC)吗?
我们有一个远程 Oracle DB 通过 VPN 隧道连接到我们的本地网络,我们使用 Hadoop 集群通过Apache Sqoop每天提取数据。想用 GCP Dataproc 集群替换这个进程来运行 sqoop 作业和 GCP 存储。发现这篇文章似乎正在Google Cloud Dataproc 中使用 Apache Sqoop 进行类似的移动数据,但它假设用户拥有GCP VPC(我不打算购买)。
所以我的问题是:
- 如果没有这个 VPC 连接,云 dataproc 集群是否知道如何使用 作业提交 API从我们本地网络上的数据库中获取数据?
- 如果是这样,这将如何工作(也许我对 Hadoop 作业的工作方式/获取数据不够了解)?
- 如果没有其他方法?