6

我有一个包含两种文件名的存储桶:

  1. [Bucket]/[file]
  2. [Bucket]/[folder]/[file]

例如,我可以:

  1. MyBucket/bar
  2. MyBucket/foo/bar

我想将所有[Bucket]/[folder]/[file]文件重命名为[Bucket]/[file]文件(从而覆盖/丢弃[Bucket]/[file]文件)。
所以和前面的例子一样,我想MyBucket/foo/bar成为MyBucket/bar(并覆盖/删除原来的MyBucket/bar)。

我尝试了两种方法:

  1. 使用 s3cmd 的 move 命令:s3cmd mv s3://MyBucket/foo/bar s3://MyBucket/bar
  2. 使用亚马逊的 php 开发工具包:rename(s3://MyBucket/foo/bar, s3://MyBucket/bar)

这两种方法似乎都有效,但是 - 考虑到我必须对数千个文件进行批处理,
我的问题是:

  1. 首选哪种方法?
  2. 还有其他更好的方法吗?
  3. 我必须在移动/重命名之前删除旧文件吗?(没有它似乎可以正常工作,但我可能不知道所涉及的风险)

谢谢你。

4

2 回答 2

5

自从我大约 5 个月前问过这个问题以来,我有一些时间来获得一些见解;所以我会自己回答:

据我所见,性能方面没有重大差异。我可以想象s3cmd,由于为每个请求调用外部进程,从 PHP 内部调用可能会很昂贵;但话又说回来 - 亚马逊的 SDK 使用 cURL 来发送它的请求,所以没有太大的区别。

我确实注意到的一个区别是,亚马逊的 SDK 倾向于抛出 cURL 异常(看似随机且很少),但s3cmd根本没有崩溃。我的脚本在成千上万个文件上运行,因此我不得不学习处理这些 cURL 异常的艰难方法。
我的理论是,当服务器上存在通信冲突时(例如,当两个进程尝试使用相同的资源时),cURL 会崩溃。我正在开发一个开发服务器,有时多个进程同时使用 cURL 访问 S3;这些是 cURL 表现出这种行为的唯一情况。

结论:
使用s3cmd可能更稳定,但使用 SDK 可以提供更多功能并更好地与您的 PHP 代码集成;只要您记得处理 SDK 抛出 cURL 异常的罕见情况(我会说每 1000 个请求 1 个,当多个进程同时运行时)。

于 2012-10-16T11:47:56.883 回答
2

由于 s3cmd 和 SDK 这两种方法最终都会发出相同的 REST 调用,因此您可以安全地选择最适合您的方法。

当你移动一个文件时,如果目标存在,它总是被替换,那么,如果你不想要这种行为,你需要检查目标文件名是否已经存在,以便执行移动操作.

于 2012-08-11T20:32:19.753 回答