0

我正在设置一个 Dataflow 管道,其中一项操作是获取/添加 GCS 文件的元数据[用户提供的元数据]。

在一个独立的 Java 应用程序中,我使用下面的方法来获取来自 StorageObject 类的元数据,但在 Apache Beam 库中没有找到类似的方法/api。任何指针都会非常有帮助。

//Below code is from StorageObject.java
com.google.api.services.storage.model.StorageObject
//.....
public java.util.Map<String, java.lang.String> getMetadata() {
     return metadata;
}
4

1 回答 1

1

我使用以下代码从 GCS 获取元数据,它在 DataFlow 管道中运行良好。

import com.google.cloud.storage.{BlobId, BlobInfo, Storage, StorageOptions}

val storage: Storage = StorageOptions.getDefaultInstance.getService
val blobId: BlobId = BlobId.of("bucket", "filename")
val srcMap: Map[String, String] = storage.get(blobId).getMetadata
于 2019-07-02T05:50:52.627 回答