我有一个问题,一个好的解决方案。我希望那里有更好的解决方案。
问题
我有一个包含大约 200,000 个整数的数组。给定两个索引 i1 和 i2,我需要计算 i1 和 i2 之间所有元素的总和。数组中的每个整数都在 1 到 4 之间(包括 1 和 4)。例如:
a = [1, 3, 2, 4, 3, 2, 4, 1];
subsection_sum(a, 0, 3); // returns 6: (1 + 3 + 2)
此操作将执行大约 200,000 次,因此需要非常快。for 循环中的一个简单计数器是 O(n),而且太慢了。数组构建后从不修改,所以有一个相对昂贵的预处理阶段是可以的。
到目前为止我最好的解决方案
该算法在 O(log n) 时间内工作:
首先用零填充原始数组,直到它的长度是 2 的幂。接下来,将数组分成两个相等的部分并存储每个部分的总和。然后将数组分成四部分并存储每个部分的总和。然后是八分之一。继续这样做,直到数组被分成 2 个元素长的部分。对于上面的 8 元素数组,这需要两个步骤:
halves = [(a[0] + a[1] + a[2] + a[3]), (a[4] + a[5] + a[6] + a[7])]
quarters = [(a[0] + a[1]), (a[2] + a[3]), (a[4] + a[5]), (a[6] + a[7])]
然后给定两个索引,现在可以在 O(log n) 时间内计算出 subsection_sum。例如,subsection_sum(a, 2, 7) == quarters[1] + halves[1]。