我编写了一个程序,它复制了一个包含大量文件的整个目录树。这同时发生在两个目的地。它生成源树中每个文件的 MD5 和,将其转储到 txt 文件并在目标端执行相同操作,并比较所有三个和是否相等,这样我可以确保每个文件都被复制并验证校验和。
问题是我首先递归地复制整个源代码树,然后再次读取整个源文件以生成源校验和。我认为在逐个文件复制文件后立即复制文件并生成源 md5 总和会更快,这样就不需要再次读取源文件。
所以我的问题是如何以高效和快速的方式完成?一项复制任务可能是 500GB 的数据和大约 40.000 个文件。