5

我正在实现一个段树,以便能够快速回答数组 A 中的以下查询:

  • 查询 i, j:范围 (i,j) 中所有元素的总和
  • 更新 i, j, k:将 k 添加到 range(i,j) 中的所有元素

这是我的实现:

typedef long long intt;

const int max_num=100000,max_tree=4*max_num;
intt A[max_num],ST[max_tree];

void initialize(int node, int be, int en) {
  if(be==en) {
    ST[node]=ST[be];
  } else {
    initialize(2*node+1,be,(be+en)/2);
    initialize(2*node+2,(be+en)/2+1,en);

    ST[node]=ST[2*node+1]+ST[2*node+2];
  }
}

void upg(int node, int be, int en, int i, intt k) {
  if(be>i || en<i || be>en) return;
  if(be==en) {
    ST[node]+=k;
    return;
  }
  upg(2*node+1, be, (be+en)/2, i, k);
  upg(2*node+2, (be+en)/2+1, en, i, k);
  ST[node] = ST[2*node+1]+ST[2*node+2];
}

intt query(int node, int be, int en, int i, int j) {
  if(be>j || en<i) return -1;
  if(be>=i && en<=j) return ST[node];

  intt q1=query(2*node+1, be, (be+en)/2, i, j);
  intt q2=query(2*node+2, (be+en)/2+1, en, i, j);

  if(q1==-1) return q2;
  else if(q2==-1) return q1;
  else return q1+q2;
}

查询函数非常快,其复杂度为 O(lg N),其中 N 为 ji。更新函数在一般情况下也很快,但是当ji很大时,更新的复杂度是O(N lg N),一点也不快。

我搜索了一下主题,发现如果我用惰性传播实现段树,查询和更新的复杂度都是 O(lg N),渐近地比 O(N lg N) 快。

我还找到了另一个问题的链接,它有一个非常好的段树实现,它使用指针:如何使用延迟传播实现段树?. 所以,这是我的问题:有没有更简单的方法来实现惰性传播,不使用指针,但使用数组索引,并且没有segment_tree数据结构?

4

2 回答 2

3

这是我在玩弄这个数据结构和一些模板愚蠢的东西。

所有这些混乱的底部是访问两个平面数组,其中一个包含一个和树,另一个包含一个进位值树,以便以后向下传播。从概念上讲,它们形成一棵二叉树。

二叉树中节点的真实值是存储和树中的值,加上节点下的叶子数乘以从节点返回到根的所有进位树值的总和。

同时,树中每个节点的真值等于其下每个叶节点的真值。

我编写了一个函数来进行进位和求和,因为事实证明它们正在访问相同的节点。读有时会写。increase因此,您可以通过用零调用它来得到一个总和。

模板tomfoolery所做的就是计算节点在每棵树中的偏移量,以及左右子节点的位置。

虽然我确实使用了 a struct,但struct它是瞬态的——它只是一个包装器,其中包含一些预先计算的值围绕一个数组的偏移量。我确实存储了一个指向数组开头的指针,但是在这个程序中每个都block_ptr使用完全相同的值。root

对于调试,我有一些疯狂的 Assert() 和 Debug() 宏,以及递归 sum 函数调用的跟踪 nullary 函数(我用它来跟踪对其的调用总数)。再一次,为了避免全局状态而变得不必要的复杂。:)

#include <memory>
#include <iostream>

// note that you need more than 2^30 space to fit this
enum {max_tier = 30};

typedef long long intt;

#define Assert(x) (!(x)?(std::cout << "ASSERT FAILED: (" << #x << ")\n"):(void*)0)
#define DEBUG(x) 

template<size_t tier, size_t count=0>
struct block_ptr
{
  enum {array_size = 1+block_ptr<tier-1>::array_size * 2};
  enum {range_size = block_ptr<tier-1>::range_size * 2};
  intt* root;
  size_t offset;
  size_t logical_offset;
  explicit block_ptr( intt* start, size_t index, size_t logical_loc=0 ):root(start),offset(index), logical_offset(logical_loc) {}
  intt& operator()() const
  {
    return root[offset];
  }
  block_ptr<tier-1> left() const
  {
    return block_ptr<tier-1>(root, offset+1, logical_offset);
  }
  block_ptr<tier-1> right() const
  {
    return block_ptr<tier-1>(root, offset+1+block_ptr<tier-1>::array_size, logical_offset+block_ptr<tier-1>::range_size);
  }
  enum {is_leaf=false};
};

template<>
struct block_ptr<0>
{
  enum {array_size = 1};
  enum {range_size = 1};
  enum {is_leaf=true};
  intt* root;
  size_t offset;
  size_t logical_offset;

  explicit block_ptr( intt* start, size_t index, size_t logical_loc=0 ):root(start),offset(index), logical_offset(logical_loc)
  {}
  intt& operator()() const
  {
    return root[offset];
  }
  // exists only to make some of the below code easier:
  block_ptr<0> left() const { Assert(false); return *this; }
  block_ptr<0> right() const { Assert(false); return *this; }
};


template<size_t tier>
void propogate_carry( block_ptr<tier> values, block_ptr<tier> carry )
{
  if (carry() != 0)
  {
    values() += carry() * block_ptr<tier>::range_size;
    if (!block_ptr<tier>::is_leaf)
    {
      carry.left()() += carry();
      carry.right()() += carry();
    }
    carry() = 0;
  }
}

// sums the values from begin to end, but not including end!
// ie, the half-open interval [begin, end) in the tree
// if increase is non-zero, increases those values by that much
// before returning it
template<size_t tier, typename trace>
intt query_or_modify( block_ptr<tier> values, block_ptr<tier> carry, int begin, int end, int increase=0, trace const& tr = [](){} )
{
  tr();
  DEBUG(
  std::cout << begin << " " << end << " " << increase << "\n";
  if (increase)
  {
    std::cout << "Increasing " << end-begin << " elements by " << increase << " starting at " << begin+values.offset << "\n";
  }
  else
  {
    std::cout << "Totaling " << end-begin << " elements starting at " << begin+values.logical_offset << "\n";
  }
  )
  if (end <= begin)
    return 0;
  size_t mid = block_ptr<tier>::range_size / 2;
  DEBUG( std::cout << "[" << values.logical_offset << ";" << values.logical_offset+mid << ";" << values.logical_offset+block_ptr<tier>::range_size << "]\n"; )
  // exatch math first:
  bool bExact = (begin == 0 && end >= block_ptr<tier>::range_size);
  if (block_ptr<tier>::is_leaf)
  {
    Assert(bExact);
  }
  bExact = bExact || block_ptr<tier>::is_leaf; // leaves are always exact
  if (bExact)
  {
    carry()+=increase;
    intt retval =  (values()+carry()*block_ptr<tier>::range_size);
    DEBUG( std::cout << "Exact sum is " << retval << "\n"; )
    return retval;
  }
  // we don't have an exact match.  Apply the carry and pass it down to children:
  propogate_carry(values, carry);
  values() += increase * end-begin;
  // Now delegate to children:
  if (begin >= mid)
  {
    DEBUG( std::cout << "Right:"; )
    intt retval = query_or_modify( values.right(), carry.right(), begin-mid, end-mid, increase, tr );
    DEBUG( std::cout << "Right sum is " << retval << "\n"; )
    return retval;
  }
  else if (end <= mid)
  {
    DEBUG( std::cout << "Left:"; )
    intt retval = query_or_modify( values.left(), carry.left(), begin, end, increase, tr );
    DEBUG( std::cout << "Left sum is " << retval << "\n"; )
    return retval;
  }
  else
  {
    DEBUG( std::cout << "Left:"; )
    intt left = query_or_modify( values.left(), carry.left(), begin, mid, increase, tr );
    DEBUG( std::cout << "Right:"; )
    intt right = query_or_modify( values.right(), carry.right(), 0, end-mid, increase, tr );
    DEBUG( std::cout << "Right sum is " << left << " and left sum is " << right << "\n"; )
    return left+right;
  }
}

这里有一些帮助类可以轻松创建给定大小的段树。但是请注意,您所需要的只是一个大小合适的数组,并且可以从指向元素 0 的指针构造一个 block_ptr,然后就可以开始了。

template<size_t tier>
struct segment_tree
{
  typedef block_ptr<tier> full_block_ptr;
  intt block[full_block_ptr::range_size];
  full_block_ptr root() { return full_block_ptr(&block[0],0); }
  void init()
  {
    std::fill_n( &block[0], size_t(full_block_ptr::range_size), 0 );
  }
};

template<size_t entries, size_t starting=0>
struct required_tier
{
  enum{ tier =
    block_ptr<starting>::array_size >= entries
    ?starting
    :required_tier<entries, starting+1>::tier
  };
  enum{ error =
    block_ptr<starting>::array_size >= entries
    ?false
    :required_tier<entries, starting+1>::error
  };
};

// max 2^30, to limit template generation.
template<size_t entries>
struct required_tier<entries, size_t(max_tier)>
{
  enum{ tier = 0 };
  enum{ error = true };
};

// really, these just exist to create an array of the correct size
typedef required_tier< 1000000 > how_big;

enum {tier = how_big::tier};


int main()
{
  segment_tree<tier> values;
  segment_tree<tier> increments;
  Assert(!how_big::error); // can be a static assert -- fails if the enum of max tier is too small for the number of entries you want
  values.init();
  increments.init();
  auto value_root = values.root();
  auto carry_root = increments.root();

  size_t count = 0;
  auto tracer = [&count](){count++;};
  intt zero = query_or_modify( value_root, carry_root, 0, 100000, 0, tracer );
  std::cout << "zero is " << zero << " in " << count << " steps\n";
  count = 0;
  Assert( zero == 0 );
  intt test2 = query_or_modify( value_root, carry_root, 0, 100, 10, tracer ); // increase everything from 0 to 100 by 10
  Assert(test2 == 1000);
  std::cout << "test2 is " << test2 << " in " << count << " steps \n";
  count = 0;
  intt test3 = query_or_modify( value_root, carry_root, 1, 1000, 0, tracer );
  Assert(test3 == 990);
  std::cout << "test3 is " << test3 << " in " << count << " steps\n";
  count = 0;
  intt test4 = query_or_modify( value_root, carry_root, 50, 5000, 87, tracer );
  Assert(test4 == 10*(100-50) + 87*(5000-50) );
  std::cout << "test4 is " << test4 << " in " << count << " steps\n";
  count = 0;
}

虽然这不是您想要的答案,但它可能会使某人更容易编写它。写这个让我很开心。所以,希望对您有所帮助!

该代码在 Ideone.com 上使用 C++0x 编译器进行了测试和编译。

于 2012-11-15T02:15:15.077 回答
-1

延迟传播意味着仅在需要时更新。它是一种允许以渐近时间复杂度 O(logN) 执行范围更新的技术(这里的 N 是范围)。

假设您要更新范围 [0,15],然后您更新节点 [0,15] 并在节点中设置一个标志,表示要更新它的子节点(使用标记值,以防标志不是用过的) 。

可能的压力测试案例:

0 1 100000

0 1 100000

0 1 100000 ...重复 Q 次(其中 Q = 99999),第 100000 个查询将是

1 1 100000

在这种情况下,大多数实现会坐下来翻转 100000 个硬币 99999 次,只是为了最终回答一个简单的查询并超时。

使用延迟传播,您只需将节点 [0,100000] 翻转 99999 次并设置/取消设置要更新其子节点的标志。当询问实际查询本身时,您开始遍历其子级并开始翻转它们,将标志向下推并取消设置父级标志。

哦,请确保您使用了正确的 I/O 例程(scanf 和 printf,而不是 cin 和 cout,如果它的 c++ 的话)希望这能让您了解延迟传播的含义。更多信息:http ://www.spoj.pl/forum/viewtopic.php?f=27&t=8296

于 2012-11-04T15:33:41.307 回答