我有 3 个文件,每个文件大小约为 6MB,我需要知道这些文件中常见的块是什么。对于块,我的意思是 128 字节长的二进制数据块。不幸的是,它们可能从任何地方开始。我需要知道,这些块出现在文件中的什么位置。我已经阅读了一些关于最长公共序列问题的文本,但我的问题有点不同,因为我不需要 2 个文件中最长的文件,但 3 个文件中的所有文件都合理。这些块没有对齐,所以一个 128 字节的块可能从任何地方开始。我很确定这很复杂,但也许有人知道这个问题的聪明解决方案,最好是使用现有的工具。
我对如何编写最愚蠢的版本有一个模糊的想法(将所有内容与所有内容进行比较),但我需要在本世纪得到一个结果;)