问题标签 [google-cloud-data-fusion]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
1373 浏览

google-cloud-data-fusion - 连接到 Cloud SQL MySQL

我们想测试使用 Cloud Data Fusion 将 Cloud SQL (mySQL) 连接到 BigQuery。连接到 CloudSQL 的正确方法是什么,因为此时这似乎不是“内置”的。推荐什么驱动程序,是否有任何可用说明?

0 投票
1 回答
930 浏览

google-cloud-data-fusion - 运行简单数据融合管道以从 Bigquery 导出数据并写入 GCS 时出现连接超时错误

我正在尝试使用谷歌数据融合服务,我创建了一个简单的管道,它将从 BigQuery 中提取数据并将该数据以 json 格式加载回 GCS,但是当我运行管道时,我收到以下错误。

java.io.IOException: com.jcraft.jsch.JSchException: java.net.ConnectException: io.cdap.cdap.common.ssh.DefaultSSHSession.(DefaultSSHSession.java:82) 处的连接超时(连接超时)~[ na:na] 在 io.cdap.cdap.internal.app.runtime.distributed.remote.RemoteExecutionTwillPreparer.lambda$start$0(RemoteExecutionTwillPreparer.java:429) ~[na:na]

我提供了对数据融合实例服务帐户的所有必要访问权限。以下是我提供的访问权限。

0 投票
2 回答
1721 浏览

cdap - 如何在 Wrangler 中使用自定义转换?

我正在尝试使用 Wrangler Plugin 上的列使用自定义转换。

是否有任何文档可以找到应用自定义转换的函数列表?同样对于特定情况,我想根据 IF-ELSE 条件(或多个情况)替换列的值。有什么办法吗?

0 投票
1 回答
512 浏览

mysql - 未能部署 Cloud Data Fusion“将数据从 MySQL 传输到 Google BigQuery”模板管道

我刚刚尝试过 Cloud Data Fusion,Transfer Data From MySQL to Google BigQuery模板管道。配置设置后,在部署管道时出现以下错误。有什么建议吗?

如何重现问题?

  1. 从 Cloud Data Fusion Hub 中选择Transfer Data From MySQL to Google BigQuery管道,将创建一个新管道。
  2. 在 MySQL 节点中配置一些设置(注意:BigQuery 节点不能修改)。
  3. 单击[部署]按钮。
  4. 将显示以下错误:
0 投票
3 回答
3060 浏览

google-cloud-data-fusion - 无法将 Cloud Data Fusion 与 Google Cloud SQL for PostgreSQL 连接

我的目标是通过 Cloud Data Fusion 管道从 Cloud SQL Postgres 读取数据到 BigQuery。

为此,我设置了一个 Cloud Data Fusion 实例并为服务帐户分配了以下两个权限:(请参阅https://cloud.google.com/data-fusion/docs/how-to/create-instance#setting_up_permissions

  • 云 SQL 客户端
  • 云数据融合 API 服务代理

作为下一步,我将自己连接到 Cloud Data Fusion Instance,并导航到Wrangler -> Add Connection -> Database -> Google Cloud SQL for PostgreSQL.

作为驱动程序,我上传了postgres-socket-factory-1.0.13-jar-with-dependencies.jar我在这里下载的:https ://github.com/GoogleCloudPlatform/cloud-sql-jdbc-socket-factory

对于驱动程序配置,我设置:

  • 名称:cloudsql-postgresql
  • 类名:org.postgresql.Driver

对于数据库连接,我设置:

  • 连接名称:<PROJECT_NAME>:<REGION>:<INSTANCE_CONNECTION_NAME>
  • 连接字符串:jdbc:postgresql://google/<DATABASE_NAME>?cloudSqlInstance=<INSTANCE_CONNECTION_NAME>&socketFactory=com.google.cloud.sql.postgres.SocketFactory
  • 用户名:数据库用户名
  • 密码:数据库密码

单击测试连接后,我收到org.postgresql.Driver错误消息。

在此处输入图像描述

0 投票
1 回答
654 浏览

google-cloud-data-fusion - Google Cloud Data Fusion - Dataproc 配置突然停止,没有任何错误消息

我设计了一个简单的管道来从 Cloud Storage 读取 CSV 文件并写入 BigQuery 表。运行管道时,操作突然停止,日志中没有任何错误消息。已经需要防火墙规则。请建议如何解决这个问题。

0 投票
1 回答
388 浏览

google-cloud-data-fusion - 输出的 CSV 文件与 Google Cloud Storage Sink 插件分开

我一直在管道中的 Sink 类别下使用 Google Cloud Storage Plugin,以获取 CSV 格式的输出。管道执行后,结果输出在拆分后进入多个文件。这是这个插件的正确行为吗?如果是,那么有没有办法在单个文件中获取合并的输出?

编辑:这似乎是插件的正确行为,在https://cloud.google.com/storage/docs/composite-objects中提到。分片是为了支持并行上传。但现在我的问题是,有没有一种简单的方法来组合所有这些拆分的文件?

0 投票
1 回答
71 浏览

google-cloud-data-fusion - 如果我使用 BigQuery 插件,BigQuery 视图无法正常工作

我一直在源类别下使用 bigquery 插件。当我使用 bigquery View 时,Pipeline 通过不允许 View 的错误。此外,如果我使用了其中存在可重复列的永久表,那么它在检索其架构时也会通过不支持的模式“重复”的错误。有人有这方面的信息吗?

0 投票
2 回答
810 浏览

google-cloud-data-fusion - Google Cloud Data Fusion 1. 未连接到 oracle 2. 当管道运行时,我收到“默认”网络端口错误

我安装了 oracle-jdbc 瘦驱动程序以与 On prem oracle DB 连接,但是当我测试连接时出现网络适配器错误

我尝试更改主机但仍然相同

错误见下图

从 GCS-BQ 运行管道时,出现网络端口错误。我们可以更改运行管道的 VPC 吗?

错误见下图

0 投票
1 回答
477 浏览

google-cloud-data-fusion - 在运行数据融合管道以将 csv 文件从 GCS 加载到 BigQuery 时,面临一些关于数据处理取消配置的问题

我正在使用数据融合来创建一个管道,它将 CSV 数据从 GCS 加载到 BigQuery。当我进行预览时,它工作正常。但是当我部署管道时,它给了我以下错误。