1

填充缓冲区并将其传递给模糊散列实现(ssdeep/sdhash)的含义是什么。

我有 2 个缓冲区,我想检查它们的相似性,但是它们很短,这些工具无法在它们上运行。

缓冲液 A:AAAAAAAAAAAAAAA 缓冲液 B:AAAAAAA* B *AAAAAAA

如您所见,它们非常相似。

如果我用 0 填充它们(页面对齐):

缓冲区 A:AAAAAAAAAAAAAAA00000000000000....0000(4096 个字节的“0”)缓冲区 B:AAAAAAA* B *AAAAAAA00000000000000....0000(4096 个字节的“0”)

相似度得分为 15。

当我尝试用随机数据填充它们时(当然,两个缓冲区都添加了相同的随机数据)。相似度得分为 86。

我使用的两种填充技术的含义是什么?我应该使用它们吗?

4

0 回答 0