0

给定一维随机数集,我们只需遍历该集,然后将数据下推到树中。在一个维度上,这非常简单。我们可以简单地比较数据的值,并决定数据将沿着树传播到哪里。

然而,对于更高的维度,距离开始变得模糊,并且更难以决定哪些数据应该在树的哪个位置。

事实上,如果我们要设计一个包含一组高维向量的层次树(例如,128 维 SIFT 特征),我们如何决定每个 n 维向量中的哪个应该去哪个子树等等?我们做的一些事情是什么?

4

1 回答 1

1

随机树

随机是用于分类或聚类的常用技术。

以下是您决定如何拆分树的每个节点的方法:

  • 从 128 个 SIFT 维度中选择一个随机的 k(小的东西,比如 5)。
  • 确定这 k 个维度中的哪个维度提供了数据的最佳拆分。

因此,每个节点都需要存储:

  1. 使用的维度
  2. 应用于该维度的决策阈值

叶子将存储:

  • 类别预测,或有关最终到达该叶节点的数据点的一些统计信息。
于 2012-12-18T07:01:52.553 回答