python - 带有md5和验证python的copytool

Question

我编写了一个程序，它复制了一个包含大量文件的整个目录树。这同时发生在两个目的地。它生成源树中每个文件的 MD5 和，将其转储到 txt 文件并在目标端执行相同操作，并比较所有三个和是否相等，这样我可以确保每个文件都被复制并验证校验和。

问题是我首先递归地复制整个源代码树，然后再次读取整个源文件以生成源校验和。我认为在逐个文件复制文件后立即复制文件并生成源 md5 总和会更快，这样就不需要再次读取源文件。

所以我的问题是如何以高效和快速的方式完成？一项复制任务可能是 500GB 的数据和大约 40.000 个文件。

score 0 · Accepted Answer

与其从头开始编写，不如查看 python 的第三方 rsync 端口 @ https://pypi.python.org/pypi/rsync.py

Rsync 已经很好地解决了这个问题。

1 回答 1