1

在列出同一存储桶中文件夹的内容时,我注意到不同的结果,具体来说,有时文件夹将列在“内容”部分(在关键元素内)下,但有时不会。请参阅以下两个输出:

此输出不包括前缀目录

<?xml version='1.0' encoding='UTF-8'?>
<ListBucketResult xmlns='http://doc.s3.amazonaws.com/2006-03-01'>
<Name>
test22</Name>                            <=== Bucket
<Prefix>
16-Jul-2013</Prefix>                     <=== Prefixed folder
<Marker>
</Marker>
<IsTruncated>
false</IsTruncated>
<Contents>
<Key>
16-Jul-2013/0371.txt</Key>               <=== ONLY OBJECTS LISTED
<Generation>
1374016944689000</Generation>
<MetaGeneration>
1</MetaGeneration>
<LastModified>
2013-07-16T23:22:24.664Z</LastModified>
<ETag>
"5d858b3ddbf51fb5ec4501799e637b47"</ETag>
<Size>
96712</Size>
<Owner>
<ID>
00b4903a97d860d9d5a7d98a1c6385dc6146049499b88ceae217eaee7a0b2ff4</ID>
</Owner>
</Contents>

但是这个输出确实

<?xml version='1.0' encoding='UTF-8'?>
<ListBucketResult xmlns='http://doc.s3.amazonaws.com/2006-03-01'>
<Name>
test22</Name>                            <=== Bucket
<Prefix>
22-Aug-2013</Prefix>                     <=== Prefixed folder
<Marker>
</Marker>
<IsTruncated>
false</IsTruncated>
<Contents>
<Key>
22-Aug-2013/</Key>                       <=== FOLDER INCLUDED IN LIST
<Generation>
1377178774399000</Generation>
<MetaGeneration>
1</MetaGeneration>
<LastModified>
2013-08-22T13:39:34.337Z</LastModified>
<ETag>
"d41d8cd98f00b204e9800998ecf8427e"</ETag>
<Size>
0</Size>
<Owner>
<ID>
00b4903a97d0b7e1f638009476bba4c5d964f744e50c23c3681357a290cb7b16</ID>
</Owner>
</Contents>

这两个请求都是使用以下代码发出的(注意我没有使用经过身份验证的会话,这些项目是公开可读的):

uri = URI('https://storage.googleapis.com/test22?prefix=16-Jul-2013')     <=== prefix changed for each case
req3 = Net::HTTP::Get.new(uri.request_uri)

#req3['Authorization'] = "#{token['token_type']} #{token['access_token']}"
req3['Content-Length'] = 0
req3['content-Type'] = 'text/plain - GB'
req3['Date'] = Time.now.strftime("%a, %d %b %Y %H:%M:%S %Z")
req3['Host'] = 'storage.googleapis.com'
req3['x-goog-api-version'] = 2
req3['x-goog-project-id'] = ###############

Net::HTTP.start(uri.host, uri.port, :use_ssl => uri.scheme == 'https') { |http|
   resp3 = http.request(req3)
   puts resp3.body.gsub(/>/, ">\n")
}

为什么有区别?我缺少一些基本的东西吗?提前致谢...

-李

4

1 回答 1

2

当您使用 Cloud Console 创建文件夹时,它会创建一个占位符对象,其中包含文件夹名称 + '/' 来表示空文件夹。即使您稍后将对象添加到文件夹,占位符仍然存在。

另一方面,如果您使用 API 直接上传名称中带有“/”的对象(例如上传到“文件夹/object.txt”),则不会创建占位符对象,因为该对象的存在足以推断文件夹的存在。如果您删除“文件夹/object.txt”,则该文件夹将不再列在 Cloud Console 的根列表中,因为没有占位符对象。

要明确回答您的问题,这意味着“16-Jul-2013/0371.txt”是通过直接上传到“16-Jul-2013/0371.txt”而创建的。相比之下,“2013 年 8 月 22 日/”是由 Cloud Console 中的“新建文件夹”按钮创建的。在后一种情况下会创建一个占位符对象,而在前一种情况下则不会。

所有这一切都是因为 GCS 命名空间是扁平的,而不是分层的。文件夹抽象可以帮助您分层可视化事物,但它有一些限制。

于 2013-08-29T21:33:27.660 回答