在 google.cloud.storage 和 list_blobs 的帮助下,我可以从特定存储桶中获取文件列表。但我想过滤(名称* .ext)存储桶中的确切文件。我无法找到确切的解决方案。
例如:buket=data,prefix_folder_name=sales,在前缀文件夹中我有带有元数据的发票列表。我想获取具体的发票及其元数据(名称*.csv 和名称。*.meta)。此外,如果我循环特定文件夹的整个 all_blob 以获取所选文件,那么它将是大量数据并且可能会影响性能。
如果有人帮助我解决这个问题,那就太好了。
bucket = gcs_client.get_bucket(buket)
all_blobs = bucket.list_blobs(prefix=prefix_folder_name)
for blob in all_blobs:
print(blob.name)