我刚刚发现了 AWS Glacier 服务,并想编写一个小型Python 应用程序来通过 REST API 上传文件。我查看了所需的标题并偶然发现了x-amz-sha256-tree-hash
. 我需要计算整个文件的 SHA-256 哈希值以及每个 1 MB 块的所有哈希值的父级哈希值。这导致以下树:
(图片取自这里)
我已经制作了一个读取 1 MB 块的函数和一个即时计算其哈希值的类,但后来我完全挣扎:
在我的应用程序中,我创建了一个名为的类chunk
,它获取数据并计算__init__
方法中的哈希值,并保存父项和子项(如常规树)。当用户打开一个文件时,这些块实例将使用它们各自的哈希正确生成(在这个例子中,这将是 7 个块实例)。
现在我有两个相互关联的大问题:
- 如何反向构建这棵树?我基本上需要为最低层上的每两个块实例创建一个新块,并根据这两个散列计算一个散列。但是我在哪里存储那个父母?在父母的孩子和做反向树行走?
- 这如何处理奇数个孩子?如果我有一个遍历每个父层的算法,那么我会错过最后一个(0.5 MB)块。
我在 SO 上查看了这个主题,但该方法仅适用于偶数儿童计数,这并不总是给出。
你能帮我找到解决这个问题的方法/算法/方法吗?
提前致谢!
保罗