1

我计划有一个 Cloud Scheduler,它每天早上 8 点调用 GCP 工作流我的 GCP 工作流将有大约 15 种不同steps,并且只会在 BigQuery 上进行转换(更新、删除、添加)。有些查询会很长,我想知道是否有办法将.sql文件加载到 GCP 工作流中task1.yaml

#workflow entrypoint
ProcessItem:
  params: [project, gcsPath]
  steps:
    - initialize:
        assign:
          - dataset: wf_samples
          - input: ${gcsPath}
          - sqlQuery: QUERY HERE
   ...
4

1 回答 1

3

你需要做类似的事情:(当然你可以把它分配给一个变量,比如input

#workflow entrypoint
main:
  steps:
    - getSqlfile:
        call: http.get
        args:
          url: https://raw.githubusercontent.com/jisaw/sqlzoo-solutions/master/select-in-select.sql
          headers:
            Content-Type: "text/plain"
        result: queryFromFile
    - final:
        return: ${queryFromFile.body}

对于可能如下所示的云存储:

 call: http.get
    args:
      url: https://storage.cloud.google.com/................./q1.sql
      headers:
        Content-Type: "text/plain"
      auth:
        type: OIDC
    result: queryFromFile

或具有这种格式的事件(不同的 URL 语法 + OAuth2)

call: http.get
    args:
      url: https://storage.googleapis.com/................./q1.sql
      headers:
        Content-Type: "text/plain"
      auth:
        type: OAuth2
    result: queryFromFile

确保调用者具有访问 Cloud Storage 文件的正确权限。

注意:在进一步测试中,要正常工作,text/plain 必须在 GCS 文件上设置 mime-type。

于 2021-05-24T20:05:03.833 回答