填充缓冲区并将其传递给模糊散列实现(ssdeep/sdhash)的含义是什么。
我有 2 个缓冲区,我想检查它们的相似性,但是它们很短,这些工具无法在它们上运行。
缓冲液 A:AAAAAAAAAAAAAAA 缓冲液 B:AAAAAAA* B *AAAAAAA
如您所见,它们非常相似。
如果我用 0 填充它们(页面对齐):
缓冲区 A:AAAAAAAAAAAAAAA00000000000000....0000(4096 个字节的“0”)缓冲区 B:AAAAAAA* B *AAAAAAA00000000000000....0000(4096 个字节的“0”)
相似度得分为 15。
当我尝试用随机数据填充它们时(当然,两个缓冲区都添加了相同的随机数据)。相似度得分为 86。
我使用的两种填充技术的含义是什么?我应该使用它们吗?