有一个硬盘有很多文件,你将如何找到其中的重复文件。
我们可以做的第一件事是根据 FILE_SIZE 分离文件。
然后我们可以使用某种算法(例如 MD5)找到每个文件的哈希值,具有相同哈希值的文件会重复。
除了使用 FILE_SIZE 之外,谁能告诉一些其他方法来隔离重复文件的候选者。也许使用文件头、扩展名或任何其他想法?
有一个硬盘有很多文件,你将如何找到其中的重复文件。
我们可以做的第一件事是根据 FILE_SIZE 分离文件。
然后我们可以使用某种算法(例如 MD5)找到每个文件的哈希值,具有相同哈希值的文件会重复。
除了使用 FILE_SIZE 之外,谁能告诉一些其他方法来隔离重复文件的候选者。也许使用文件头、扩展名或任何其他想法?