给定一维随机数集,我们只需遍历该集,然后将数据下推到树中。在一个维度上,这非常简单。我们可以简单地比较数据的值,并决定数据将沿着树传播到哪里。
然而,对于更高的维度,距离开始变得模糊,并且更难以决定哪些数据应该在树的哪个位置。
事实上,如果我们要设计一个包含一组高维向量的层次树(例如,128 维 SIFT 特征),我们如何决定每个 n 维向量中的哪个应该去哪个子树等等?我们做的一些事情是什么?
给定一维随机数集,我们只需遍历该集,然后将数据下推到树中。在一个维度上,这非常简单。我们可以简单地比较数据的值,并决定数据将沿着树传播到哪里。
然而,对于更高的维度,距离开始变得模糊,并且更难以决定哪些数据应该在树的哪个位置。
事实上,如果我们要设计一个包含一组高维向量的层次树(例如,128 维 SIFT 特征),我们如何决定每个 n 维向量中的哪个应该去哪个子树等等?我们做的一些事情是什么?
随机树是用于分类或聚类的常用技术。
以下是您决定如何拆分树的每个节点的方法:
因此,每个节点都需要存储:
叶子将存储: