2

我编写了一个程序,它复制了一个包含大量文件的整个目录树。这同时发生在两个目的地。它生成源树中每个文件的 MD5 和,将其转储到 txt 文件并在目标端执行相同操作,并比较所有三个和是否相等,这样我可以确保每个文件都被复制并验证校验和。

问题是我首先递归地复制整个源代码树,然后再次读取整个源文件以生成源校验和。我认为在逐个文件复制文件后立即复制文件并生成源 md5 总和会更快,这样就不需要再次读取源文件。

所以我的问题是如何以高效和快速的方式完成?一项复制任务可能是 500GB 的数据和大约 40.000 个文件。

4

1 回答 1

0

与其从头开始编写,不如查看 python 的第三方 rsync 端口 @ https://pypi.python.org/pypi/rsync.py

Rsync 已经很好地解决了这个问题。

于 2013-11-01T06:52:00.460 回答